বৃহস্পতিবার, ১৫ মে ২০২৫, ০৬:২৯ পূর্বাহ্ন




লিখিত ‘বর্ণনা’ থেকে গান তৈরি করে গুগলের এআই

আউটলুক বাংলা রিপোর্ট
  • প্রকাশের সময়: মঙ্গলবার, ৩১ জানুয়ারী, ২০২৩ ১১:৩৬ am
Google LLC American multinational technology company search engine technology online advertising cloud computing computer software alphabet android google অ্যান্ড্রয়েড গুগল গুগল মূল সংস্থা অ্যালফাবেট ইনকরপোরেটেড মার্কিন যুক্তরাষ্ট্রের ইন্টারনেট সফটওয়্যার সেবাদানকারী বহুজাতিক কোম্পানি গুগল সার্চ ইঞ্জিন অনলাইন বিজ্ঞাপন সেবা ও ক্লাউড কম্পিউটিং প্রোগ্রাম alphabet
file pic

চ্যাটজিপিটি’র পর এবার কৃত্রিম বুদ্ধিমত্তা খাতের সম্মুখসারিতে চলে আসতে পারে এআই’র সহায়তায় সঙ্গীতের মতো কনটেন্ট তৈরি। সম্প্রতি এমনই এক ব্যবস্থা নিয়ে গবেষণা চালিয়েছে সার্চ জায়ান্ট গুগল।

গুগলের প্রকাশিত গবেষণায় উঠে এসেছে ‘মিউজিকএলএম’ নামের এক ব্যবস্থার কথা, যার মাধ্যমে কেবল টেক্সট বর্ণনা থেকেই তৈরি করা যাবে যে কোনো ধারার সঙ্গীত।

তবে কৃত্রিম বুদ্ধিমত্তার মাধ্যমে সঙ্গীত তৈরির এটিই প্রথম প্রকল্প নয়। গুগলের ‘অডিওএমএল’ ও ওপেনএআই’র ‘জুকবক্স’ একই বিষয়ে কাজ করেছে। মিউজিকএলএম-এর মডেল ও বিশাল প্রশিক্ষণ ডেটাবেস (দুই লাখ ৮০ হাজার ঘন্টার সঙ্গীত রয়েছে) এতে চমকপ্রদ বৈচিত্র্য ও গভীরতার সঙ্গে সঙ্গীত তৈরিতে সহায়তা করে। আর ব্যবহারকারীও এর আউটপুট পছন্দ করবেন বলে উঠে এসেছে প্রযুক্তিবিষয়ক সাইট এনগ্যাজেটের প্রতিবেদনে।

এই ব্যবস্থা কেবল বিভিন্ন ধারার সঙ্গীত ও বাদ্যযন্ত্রই সমন্বিত করে না, বরং বিভিন্ন ‘বিমূর্ত ধারণা’ ব্যবহার করে এমন গানও লিখতে পারে, যা কোনো কম্পিউটারের পক্ষে আয়ত্তে আনা তুলনামূলক জটিল।

উদাহরণ হিসেবে, কেউ যদি নাচের মিউজিক ও রেগেটোন (যুক্তরাষ্ট্র নিয়ন্ত্রিত ক্যারাবীয় দ্বীপ পুয়ের্তো রিকো’র লোকনৃত্যের সঙ্গীত)-এর মিশ্রণ ঘটিয়ে এমন এক ‘ভিন্ন জাগতিক’ সুর তৈরি করতে চান যা সবার মধ্যে ‘বিস্ময়কর অনুভূতি’ যোগাতে পারে, তবে সেটি করে দেবে মিউজিকএলএম।

এই প্রযুক্তি গুনগুন, শিস বা চিত্রকর্মের বর্ণনার ওপর ভিত্তি করেও সুর তৈরি করতে পারে। এনগ্যাজেট বলছে, এর ‘স্টোরি মোড’ কোনো ‘ডিজে সেট’ বা ‘সাউন্ডট্র্যাক’ তৈরির উদ্দেশ্যে একসঙ্গে বেশ কিছু সংখ্যক বর্ণনার সংমিশ্রণ ঘটাতে পারে।

তবে, অন্যান্য ‘এআই জেনারেটরের’ মতোই মিউজিকএলএমের সমস্যাও আছে। এর কয়েকটি সঙ্গীত রচনা কিছুটা অদ্ভুত শোনায়। আর এর গায়কের গলাও ঠিক বোধগম্য নয়।

এর কার্যকারিতা ব্যবহারকারীর প্রত্যাশার চেয়ে ভালো হলেও এটি এমনভাবে পুনরাবৃত্তিমূলক হতে পারে, যা কোনো মানুষের বেলায় নাও ঘটতে পারে। ফলে, কোনো প্রচলিত গানে ‘ইলেকট্রনিক ডান্স মিউজিক’ (ইডিএম) ধাঁচের ড্রপ বা গানের ‘শ্লোক-কোরাস-শ্লোক’ নকশা এর কাছ থেকে প্রত্যাশা না করাই ভালো।

এনগ্যাজেট বলছে, গুগলের অন্যান্য এআই জেনারেটরের মতোই কপিরাইট বিষয়ক শঙ্কা থাকায় সর্বজনীনভাবে ‘মিউজিকএলএম’ প্রকাশ করছেন না গবেষকরা।




আরো






© All rights reserved © outlookbangla

Developer Design Host BD