Bàn phím mới kooky của Amazon cho phép con người và AI viết nhạc cùng nhau

Tiện ích này từ Amazon Web Services thể hiện sức mạnh của AI bằng cách giúp các nhà phát triển sáng tác mọi thứ từ nhạc jazz đến nhạc rock với sự trợ giúp từ mạng lưới thần kinh.
Bàn phím mới kooky của Amazon cho phép con người và AI viết nhạc cùng nhau
[Ảnh: lịch sự của Amazon]
BỞI MARK SULLIVAN5 PHÚT ĐỌC
Amazon đã đưa ra một cách giải trí nhưng không thể khiến các nhà phát triển hào hứng khi sử dụng các dịch vụ AI của mình: âm nhạc.

Tại sự kiện AWS re: Invent ở Las Vegas vào tối Chủ nhật, công ty đã tiết lộ một bàn phím âm nhạc mới có tên DeepComposer, nhà phát triển có thể sử dụng để soạn nhạc phối hợp với các mô hình AI thế hệ của Amazon chạy trên đám mây. Bàn phím cắm vào PC, nơi con người có thể sử dụng bảng điều khiển để giao tiếp và cộng tác với các mô hình AI. Amazon gọi DeepComposer, bàn phím âm nhạc hỗ trợ học máy đầu tiên trên thế giới.

AI sáng tạo tạo ra nghệ thuật, văn bản, âm nhạc hoặc nội dung khác dựa trên các ví dụ được cung cấp cho nó thông qua các mô hình học máy. Trong trường hợp này, các mô hình AWS có thể tạo ra một phần đệm gồm bốn phần xung quanh giai điệu đơn giản hoặc tiến trình hợp âm mà nhà phát triển có thể chơi trên bàn phím. Nhạc đệm có thể thuộc một trong bốn phong cách thể loại Rock, pop, jazz hoặc cổ điển.

Mike Miller [Ảnh: Mark Sullivan]
Nhưng vấn đề không phải là tạo ra âm nhạc tuyệt vời (chính xác là nó không làm điều đó) mà là để làm quen với các mô hình AI tạo ra các giai điệu.
Kỹ sư của AWS, Mike Miller, người đã chuyển từ nhóm thiết kế điện tử tiêu dùng của Amazon cho biết: "Toàn bộ hệ thống này, DeepComposer, được thiết kế để mang đến cho các nhà phát triển cơ hội thực hành để tìm hiểu về công nghệ mới này, đồng thời vui chơi với âm nhạc. Lab126 đến AWS để tạo ra các mô hình AI tổng quát để tạo nhạc.

Đây là hướng dẫn cho các nhà phát triển trong suốt quá trình sử dụng AI thế hệ bằng cách bắt đầu chỉ bằng cách hiểu về cách thức hoạt động của quy trình sáng tạo, hiểu cách các mô hình thế hệ được đào tạo, theo Miller Miller. Sau đó, lấy kiến thức đó và cho phép họ áp dụng nó vào các lĩnh vực khác và đào tạo các mô hình của riêng họ.

Bàn phím này giống với loại bàn phím mini giá rẻ mà một số người sử dụng để chơi các nhạc cụ ảo trong ứng dụng máy trạm âm thanh kỹ thuật số (DAW) như GarageBand hoặc Pro Tools. Thật khó chịu và các phím quá nhỏ cho bất kỳ trò chơi nghiêm túc nào. Nhưng, một lần nữa, nó có nghĩa là cho các nhà phát triển, không phải nhạc sĩ.

NHẠC DỮ LIỆU LỚN
Làm thế nào để người mẫu biết cách tạo ra âm nhạc gốc và phù hợp với phong cách cụ thể? Bằng cách ăn nhiều và rất nhiều dữ liệu đào tạo. Miller và nhóm của ông đã sử dụng hàng ngàn bản nhạc thuộc phạm vi công cộng từ nhiều thể loại khác nhau làm dữ liệu đào tạo và đưa nó vào mô hình thông qua các tệp MIDI chứa các đoạn nhạc tám thước đo. Mạng thần kinh sau đó xử lý dữ liệu và học hỏi từ các mẫu trong các loại nhạc khác nhau.

DeepComposer sử dụng mạng thần kinh đối kháng thế hệ (GANN) để tạo nhạc đệm gốc dựa trên đầu vào của người dùng trên bàn phím.

Thông minh về phần cứng, DeepComposer trông giống như một bàn phím âm nhạc khá điển hình. [Ảnh: lịch sự của Amazon]
Miller nói với tôi rằng GANN thực sự chứa hai mô hình. Người ta đóng vai trò là người tạo ra những người tạo ra những người tạo ra các nốt nhạc và cụm từ. Những người khác hoạt động như một người phân biệt đối xử người Hồi giáo, người liên tục đưa ra phản hồi cho người tạo để thúc đẩy nó tạo ra âm nhạc phù hợp hơn với thể loại này. Miller cho biết, ông nghĩ về máy phát điện trực tuyến, là một dàn nhạc tạo ra âm thanh và của người phân biệt đối xử, là một nhạc trưởng không ngừng hướng dẫn và sửa lỗi cho người chơi.
GÂY NHIỄU VỚI GANN
Tôi đã đến thăm Miller tại các văn phòng của Amazon ở Palo Alto để tôi có thể tự mình thử DeepComposer. Khi tôi ngồi xuống bàn phím và tạo cho AI một giai điệu để ứng biến xung quanh, tôi sẽ không nói rằng chúng tôi đã tạo ra âm nhạc tuyệt vời cùng nhau. Nhưng chúng tôi đã tạo ra âm nhạc thú vị, và thật thú vị khi xem AI thực hiện các lựa chọn âm nhạc và phong cách thực sự, gần như trong thời gian thực.

Một vài ví dụ:

Jazz. Sau khi tôi đưa ra một tiến trình hợp âm đơn giản vào mô hình giáo dục ngay bây giờ, chỉ có thể tạo ra những ngẫu hứng tám biện pháp, tôi đã yêu cầu nó tạo ra một nhạc đệm trong thể loại nhạc jazz. Mặc dù tiến trình tôi đã chơi là không phức tạp, phần đệm kết quả tôi nghe thấy có chút liên quan đến nó. Các hợp âm tôi nghe thấy tiếng đàn piano là, tốt, kỳ quái. Nghe có vẻ như ai đó nhấn xuống càng nhiều phím càng tốt bằng cả hai tay, sau đó buông ra, sau đó lặp lại.

Pop. Miller nói với tôi rằng các mô hình đã tiến xa hơn trong việc học chơi trong các thể loại nhạc pop và rock. Tôi đã chơi một giai điệu pop hoa trên bàn phím. Lần này, phần đệm được tạo bởi mô hình có liên quan rõ ràng với những gì tôi đã chơi trên bàn phím. Tay trống đã quyết định phân phối với nhịp trống snare hoàn toàn và thay vào đó chơi các chuỗi nhanh trên một cymbal. Người chơi bàn phím đánh một vài con sò.

Đá. Trong một bài hát, AI làm tôi ngạc nhiên khi chơi một nhịp điệu nửa thời gian đằng sau sự thành công nhanh chóng của các nốt nhạc tôi đã chơi trên bàn phím. Tôi nghe một cây đàn guitar chơi một chút liếm ngẫu hứng mà nghe có vẻ nguyên bản. Mặt khác, tôi nghe nói rằng cây guitar AI tương tự đột nhiên phát ra một vài nốt nhạc hoàn toàn ngẫu nhiên và bất hòa. Khi được đào tạo nhiều hơn, bộ phân biệt đối xử trong mô hình có thể nhận ra các ghi chú đó là lỗi và sửa lỗi trình tạo.

Sau khi chơi với DeepComposer trong nửa giờ, tôi có thể nghe cách trình tạo và phân biệt đối xử làm việc cùng nhau. Miller đã chơi cho tôi hiệu suất của máy phát điện sau nhiều vòng phản hồi và chỉnh sửa, và tôi có thể nghe thấy âm nhạc được cải thiện, cả về âm nhạc và phong cách.

Tôi cũng có cảm giác rằng các mạng lưới thần kinh tìm thấy con đường của họ để tạo ra âm nhạc vừa lòng, thể loại rất khác so với con người. Những sai lầm của mô hình là chói tai và ra khỏi bối cảnh, nhưng nó cũng có khả năng phát triển mạnh mẽ. Hầu hết các nhạc sĩ loài người, theo kinh nghiệm của tôi, ẩn giấu sự an toàn của tính phái sinh cho đến khi họ có đủ kinh nghiệm để có một bước nhảy vọt về tính nguyên bản.

LÀM CHO AI VUI
Miller nói với tôi rằng DeepComposer là một cách để khiến các nhà phát triển nhìn thấy các khả năng sử dụng dịch vụ đám mây AWS AI nói chung, chứ không phải để quảng bá một dịch vụ AI thế hệ cụ thể. AI có thể cảm thấy nản chí với một số nhà phát triển vì sự phức tạp của các mô hình và ý tưởng rằng thiết kế chúng cũng nghệ thuật không kém gì khoa học. AWS đang cố gắng sử dụng niềm vui để phá vỡ các rào cản.

DeepComposer, DeepLens và DeepRacer của AWS. [Ảnh: lịch sự của Amazon]
AWS đã sử dụng phương pháp đó trước đây. Vào năm ngoái: Invent AWS đã cung cấp cho các nhà phát triển một chiếc xe đua mini có tên DeepRacer và thách thức họ tạo ra các mô hình học tăng cường hướng dẫn chiếc xe an toàn trên đường đua. Năm trước, nó đã công bố một camera DeepLens , trên đó các nhà phát triển có thể chạy các mô hình AI thị giác máy tính của riêng họ để nhận ra các vật thể.
Amazon sẽ bán bàn phím DeepComposer (với dịch vụ AI đám mây đồng hành) trên Amazon.com. Nó có nghĩa là cho các nhà phát triển, nhưng không có gì ngăn cản những người không chuyên về công nghệ tò mò mua nó. Amazon vẫn chưa đặt giá tại thời điểm viết bài này.

Tìm kiếm Blog này

Thời đại công nghệ cao

Bàn phím mới kooky của Amazon cho phép con người và AI viết nhạc cùng nhau

Nhận xét

Đăng nhận xét

Bài đăng phổ biến từ blog này

Chú chó robot từ các video lan truyền của Boston Dynamics đã sẵn sàng cho công việc thực sự

Những người lao động được giáo dục tốt hơn, được trả lương cao hơn sẽ bị 'ảnh hưởng nhiều nhất' bởi AI, theo nghiên cứu mới