অনলাইন ডেস্ক
কৃত্রিম বুদ্ধিমত্তা বা এআই মানুষের সময় বাঁচাবে ও উৎপাদনশীলতা বাড়াবে বলে দাবি করে বড় বড় প্রযুক্তি কোম্পানি। বিশেষ করে, ব্যস্ত জীবনে সময় বাঁচাতে ইউটিউব ভিডিওর বিষয়বস্তু জানার জন্য এআই এখন অনেকটাই নির্ভরযোগ্য হয়ে উঠেছে। যেমন দীর্ঘ ১৫ বা ৩০ মিনিটের ইউটিউব ভিডিও থেকে গুরুত্বপূর্ণ তথ্য দ্রুত জানতে এআইয়ের সাহায্য নেওয়া যায়। আর এ জন্য গুগলের জেমিনির নতুন এআই মডেল ব্যবহার করা যাবে।
গুগলের নতুন এআই মডেল জেমেনি ২.০ ফ্ল্যাশ থিংকিং এক্সপেরিমেন্টাল এখন গুগল সার্চ, ম্যাপস ও ইউটিউবের সঙ্গে কাজ করতে পারে। এটি সবধরনের ব্যবহারকারীর জন্য উন্মুক্ত, এমনকি বিনা মূল্যেও ব্যবহার করা যাবে।
ভিডিওর বিষয়বস্তু বিশ্লেষণ
ইউটিউব ভিডিও থেকে দ্রুত তথ্য পেতে চাইলে গুগলের নতুন এআই মডেল হতে পারে কার্যকর একটি সহায়ক হাতিয়ার।
সম্প্রতি এই এআইয়ের কার্যকারিতা যাচাই করতে দ্য গ্র্যান্ড বুদাপেস্ট হোটেল সিনেমার ৪ মিনিট ৩০ সেকেন্ডের একটি বিহাইন্ড দ্য সিনস ভিডিও বিশ্লেষণ করে দেখে প্রযুক্তিবিষয়ক ওয়েবসাইট ওয়্যারড। ব্যবহারকারীর প্রশ্নের জবাবে জেমিনি খুব দ্রুতই সিনেমার নাম ও ভিডিওর মূল বক্তব্যগুলো শনাক্ত করে ফেলে।
তবে এর কিছু সীমাবদ্ধতা রয়েছে। যেমন ভিডিওতে যেসব ব্যক্তিরা কথা বলছিলেন, তাঁদের নাম স্ক্রিনে দেখানো হলেও জেমিনি তা শনাক্ত করতে পারেনি। এমনকি ভিডিওর বিবরণে পরিচালকের নাম উল্লেখ থাকলেও সেটিও এআই বলতে পারেনি। কারণ, জেমিনি এখনো মূলত ভিডিওর অডিও বা ট্রান্সক্রিপ্টের ওপর নির্ভর করেই কাজ করে।
তবু অডিও-নির্ভর সারাংশ তৈরিতে এর দক্ষতা চোখে পড়ার মতো। তবে জেমিনি শুটিং লোকেশন খোঁজা বা অতিরিক্ত শিল্পী ব্যবহারের মতো বিষয়গুলো সঠিকভাবে চিহ্নিত করে এবং প্রতিটি তথ্যের সময় উল্লেখ করে।
খেলার হাইলাইটস বিশ্লেষণেও কার্যকর
গুগল জেমিনি দিয়ে কোনো খেলার ভিডিও বিশ্লেষণ করা যায়। এই খেলায় কী ঘটছে—এমন প্রশ্ন করা হলে কয়েক সেকেন্ডের মধ্যে জেমিনি জানিয়ে দেয় কোন দল খেলেছে, কে জয়ী হয়েছে এবং তুলে ধরে কয়েকটি গুরুত্বপূর্ণ মুহূর্ত।
চূড়ান্ত স্কোর জানতে চাওয়ার পর সঠিক উত্তর দেয় এআই। খেলার ভিডিও বিশ্লেষণে জেমিনি মূলত ভিডিওর ধারাভাষ্যের ওপর নির্ভরশীল, যা খুব অস্বাভাবিক নয়। যেখানে নির্ভুল ও গুরুত্বপূর্ণ তথ্য ধারাভাষ্যে উল্লেখ থাকে, সেখানে এটি ভালো কাজ করে। তবে জটিল বা ভিজ্যুয়ালনির্ভর খেলার মুহূর্ত বোঝার ক্ষেত্রে এখনো কিছু সীমাবদ্ধতা রয়ে গেছে।
সাক্ষাৎকারমূলক ভিডিও বিশ্লেষণ
ইউটিউব সাক্ষাৎকার ভিডিও থেকে গুরুত্বপূর্ণ তথ্য বের করতে গুগল জেমিনি এআইয়ের কার্যকারিতা আরও এক ধাপ এগিয়ে। এই ফিচার নিয়ে পরীক্ষা করার জন্য যুক্তরাজ্যের চ্যানেল ৪-এর একটি সাক্ষাৎকারমূলক ভিডিওর সারাংশ তৈরি করতে বলা হয়। যেখানে ব্ল্যাক মিরর সিরিজ নিয়ে কথা বলেন নির্মাতা চার্লি ব্রুকার ও অভিনেত্রী সিয়েনা কেলি। পুরো ভিডিওটি মূলত কথোপকথননির্ভর হওয়ায় জেমিনি সহজেই গুরুত্বপূর্ণ তথ্যগুলো শনাক্ত করতে পারে এবং টাইম স্ট্যাম্পসহ সেগুলো উপস্থাপন করে।
তবে পূর্ববর্তী পরীক্ষার মতো এখানেও জেমিনির কিছু সীমাবদ্ধতা রয়েছে। ভিডিওতে অংশগ্রহণকারীদের ভঙ্গিমা, অভিব্যক্তি কিংবা সাক্ষাৎকার কোথায় হচ্ছে—এ ধরনের ভিজ্যুয়াল তথ্য বিশ্লেষণ করতে পারেনি এআই। কারণ, জেমিনি এখনো শুধু ভিডিওর অডিও বা ট্রান্সক্রিপ্টের ভিত্তিতেই বিশ্লেষণ করে।
ইউটিউব ভিডিওতে যদি প্রয়োজনীয় তথ্য অডিও বা সাবটাইটেল থাকে, তাহলে জেমিনি এআই আরও বেশ কার্যকরভাবে সারাংশ তৈরি করে দেবে। তবে দৃশ্যনির্ভর তথ্য বা পরিস্থিতি বুঝতে হলে নিজেকেই ভিডিওটি দেখতে হবে।
এ রকম সারসংক্ষেপ তৈরির পদ্ধতি তুলে ধরা হলো—
জেমিনির এই নতুন ফিচার অ্যান্ড্রয়েড ও আইওএস অ্যাপে খুঁজে পাওয়া বেশ সহজ। এ জন্য অ্যাপে নতুন চ্যাট শুরু করে ওপরের দিকে থাকা ড্রপ-ডাউন মেনুতে ক্লিক করুন। যেখানে আপনার বর্তমানে ব্যবহৃত মডেলের নাম লেখা থাকবে। সেখানেই ২.০ ফ্ল্যাশ থিংকিং এক্সপেরিমেন্টাল অপশনটি দেখতে পাবেন।
এখন শুধু জেমিনিকে ইউটিউব ভিডিওর লিংক দিয়ে প্রম্পটে বলতে হবে তার সারাংশ তৈরি করে দিতে। এভাবে খুব দ্রুত ভিডিওর সারাংশ তৈরি করে দেবে। পরে ভিডিও সম্পর্কে অতিরিক্ত কোনো প্রশ্নও করতে পারবেন।
ফিচারটি ওয়েব ব্রাউজারে ব্যবহার করা আরও সহজ, কারণ, সহজেই ইউটিউব ভিডিওর লিংক টেনে নিয়ে অন্য ট্যাবে বিশ্লেষণের জন্য দিতে পারেন। যখন আপনি ওয়েবে জেমিনি চালুর জন্য নতুন চ্যাট শুরু করেন ও ওপরের বাম কোণে থাকা মডেল পিকারে যান, সেখানে আপনি ২.০ ফ্ল্যাশ থিংকিং এক্সপেরিমেন্টাল নামের একটি মডেল দেখতে পাবেন। এই মডেলই গুগলের বিভিন্ন অ্যাপের (যেমন গুগল সার্চ, ম্যাপস ও ইউটিউব) সঙ্গে সংযুক্ত। তবে বেশির ভাগ ক্ষেত্রে আপনাকে নির্দিষ্ট করে জানাতে হবে আপনি কোন অ্যাপটি ব্যবহার করতে চাইছেন (যেমন গুগল ম্যাপসের কোনো জায়গা খুঁজতে চাইলে সেটি উল্লেখ করতে হয়)। শুধু ভিডিও বিশ্লেষণই নয়, নতুন কনটেন্ট খুঁজতেও জেমিনি ব্যবহার করতে পারেন।
তথ্যসূত্র: ওয়্যারড
কৃত্রিম বুদ্ধিমত্তা বা এআই মানুষের সময় বাঁচাবে ও উৎপাদনশীলতা বাড়াবে বলে দাবি করে বড় বড় প্রযুক্তি কোম্পানি। বিশেষ করে, ব্যস্ত জীবনে সময় বাঁচাতে ইউটিউব ভিডিওর বিষয়বস্তু জানার জন্য এআই এখন অনেকটাই নির্ভরযোগ্য হয়ে উঠেছে। যেমন দীর্ঘ ১৫ বা ৩০ মিনিটের ইউটিউব ভিডিও থেকে গুরুত্বপূর্ণ তথ্য দ্রুত জানতে এআইয়ের সাহায্য নেওয়া যায়। আর এ জন্য গুগলের জেমিনির নতুন এআই মডেল ব্যবহার করা যাবে।
গুগলের নতুন এআই মডেল জেমেনি ২.০ ফ্ল্যাশ থিংকিং এক্সপেরিমেন্টাল এখন গুগল সার্চ, ম্যাপস ও ইউটিউবের সঙ্গে কাজ করতে পারে। এটি সবধরনের ব্যবহারকারীর জন্য উন্মুক্ত, এমনকি বিনা মূল্যেও ব্যবহার করা যাবে।
ভিডিওর বিষয়বস্তু বিশ্লেষণ
ইউটিউব ভিডিও থেকে দ্রুত তথ্য পেতে চাইলে গুগলের নতুন এআই মডেল হতে পারে কার্যকর একটি সহায়ক হাতিয়ার।
সম্প্রতি এই এআইয়ের কার্যকারিতা যাচাই করতে দ্য গ্র্যান্ড বুদাপেস্ট হোটেল সিনেমার ৪ মিনিট ৩০ সেকেন্ডের একটি বিহাইন্ড দ্য সিনস ভিডিও বিশ্লেষণ করে দেখে প্রযুক্তিবিষয়ক ওয়েবসাইট ওয়্যারড। ব্যবহারকারীর প্রশ্নের জবাবে জেমিনি খুব দ্রুতই সিনেমার নাম ও ভিডিওর মূল বক্তব্যগুলো শনাক্ত করে ফেলে।
তবে এর কিছু সীমাবদ্ধতা রয়েছে। যেমন ভিডিওতে যেসব ব্যক্তিরা কথা বলছিলেন, তাঁদের নাম স্ক্রিনে দেখানো হলেও জেমিনি তা শনাক্ত করতে পারেনি। এমনকি ভিডিওর বিবরণে পরিচালকের নাম উল্লেখ থাকলেও সেটিও এআই বলতে পারেনি। কারণ, জেমিনি এখনো মূলত ভিডিওর অডিও বা ট্রান্সক্রিপ্টের ওপর নির্ভর করেই কাজ করে।
তবু অডিও-নির্ভর সারাংশ তৈরিতে এর দক্ষতা চোখে পড়ার মতো। তবে জেমিনি শুটিং লোকেশন খোঁজা বা অতিরিক্ত শিল্পী ব্যবহারের মতো বিষয়গুলো সঠিকভাবে চিহ্নিত করে এবং প্রতিটি তথ্যের সময় উল্লেখ করে।
খেলার হাইলাইটস বিশ্লেষণেও কার্যকর
গুগল জেমিনি দিয়ে কোনো খেলার ভিডিও বিশ্লেষণ করা যায়। এই খেলায় কী ঘটছে—এমন প্রশ্ন করা হলে কয়েক সেকেন্ডের মধ্যে জেমিনি জানিয়ে দেয় কোন দল খেলেছে, কে জয়ী হয়েছে এবং তুলে ধরে কয়েকটি গুরুত্বপূর্ণ মুহূর্ত।
চূড়ান্ত স্কোর জানতে চাওয়ার পর সঠিক উত্তর দেয় এআই। খেলার ভিডিও বিশ্লেষণে জেমিনি মূলত ভিডিওর ধারাভাষ্যের ওপর নির্ভরশীল, যা খুব অস্বাভাবিক নয়। যেখানে নির্ভুল ও গুরুত্বপূর্ণ তথ্য ধারাভাষ্যে উল্লেখ থাকে, সেখানে এটি ভালো কাজ করে। তবে জটিল বা ভিজ্যুয়ালনির্ভর খেলার মুহূর্ত বোঝার ক্ষেত্রে এখনো কিছু সীমাবদ্ধতা রয়ে গেছে।
সাক্ষাৎকারমূলক ভিডিও বিশ্লেষণ
ইউটিউব সাক্ষাৎকার ভিডিও থেকে গুরুত্বপূর্ণ তথ্য বের করতে গুগল জেমিনি এআইয়ের কার্যকারিতা আরও এক ধাপ এগিয়ে। এই ফিচার নিয়ে পরীক্ষা করার জন্য যুক্তরাজ্যের চ্যানেল ৪-এর একটি সাক্ষাৎকারমূলক ভিডিওর সারাংশ তৈরি করতে বলা হয়। যেখানে ব্ল্যাক মিরর সিরিজ নিয়ে কথা বলেন নির্মাতা চার্লি ব্রুকার ও অভিনেত্রী সিয়েনা কেলি। পুরো ভিডিওটি মূলত কথোপকথননির্ভর হওয়ায় জেমিনি সহজেই গুরুত্বপূর্ণ তথ্যগুলো শনাক্ত করতে পারে এবং টাইম স্ট্যাম্পসহ সেগুলো উপস্থাপন করে।
তবে পূর্ববর্তী পরীক্ষার মতো এখানেও জেমিনির কিছু সীমাবদ্ধতা রয়েছে। ভিডিওতে অংশগ্রহণকারীদের ভঙ্গিমা, অভিব্যক্তি কিংবা সাক্ষাৎকার কোথায় হচ্ছে—এ ধরনের ভিজ্যুয়াল তথ্য বিশ্লেষণ করতে পারেনি এআই। কারণ, জেমিনি এখনো শুধু ভিডিওর অডিও বা ট্রান্সক্রিপ্টের ভিত্তিতেই বিশ্লেষণ করে।
ইউটিউব ভিডিওতে যদি প্রয়োজনীয় তথ্য অডিও বা সাবটাইটেল থাকে, তাহলে জেমিনি এআই আরও বেশ কার্যকরভাবে সারাংশ তৈরি করে দেবে। তবে দৃশ্যনির্ভর তথ্য বা পরিস্থিতি বুঝতে হলে নিজেকেই ভিডিওটি দেখতে হবে।
এ রকম সারসংক্ষেপ তৈরির পদ্ধতি তুলে ধরা হলো—
জেমিনির এই নতুন ফিচার অ্যান্ড্রয়েড ও আইওএস অ্যাপে খুঁজে পাওয়া বেশ সহজ। এ জন্য অ্যাপে নতুন চ্যাট শুরু করে ওপরের দিকে থাকা ড্রপ-ডাউন মেনুতে ক্লিক করুন। যেখানে আপনার বর্তমানে ব্যবহৃত মডেলের নাম লেখা থাকবে। সেখানেই ২.০ ফ্ল্যাশ থিংকিং এক্সপেরিমেন্টাল অপশনটি দেখতে পাবেন।
এখন শুধু জেমিনিকে ইউটিউব ভিডিওর লিংক দিয়ে প্রম্পটে বলতে হবে তার সারাংশ তৈরি করে দিতে। এভাবে খুব দ্রুত ভিডিওর সারাংশ তৈরি করে দেবে। পরে ভিডিও সম্পর্কে অতিরিক্ত কোনো প্রশ্নও করতে পারবেন।
ফিচারটি ওয়েব ব্রাউজারে ব্যবহার করা আরও সহজ, কারণ, সহজেই ইউটিউব ভিডিওর লিংক টেনে নিয়ে অন্য ট্যাবে বিশ্লেষণের জন্য দিতে পারেন। যখন আপনি ওয়েবে জেমিনি চালুর জন্য নতুন চ্যাট শুরু করেন ও ওপরের বাম কোণে থাকা মডেল পিকারে যান, সেখানে আপনি ২.০ ফ্ল্যাশ থিংকিং এক্সপেরিমেন্টাল নামের একটি মডেল দেখতে পাবেন। এই মডেলই গুগলের বিভিন্ন অ্যাপের (যেমন গুগল সার্চ, ম্যাপস ও ইউটিউব) সঙ্গে সংযুক্ত। তবে বেশির ভাগ ক্ষেত্রে আপনাকে নির্দিষ্ট করে জানাতে হবে আপনি কোন অ্যাপটি ব্যবহার করতে চাইছেন (যেমন গুগল ম্যাপসের কোনো জায়গা খুঁজতে চাইলে সেটি উল্লেখ করতে হয়)। শুধু ভিডিও বিশ্লেষণই নয়, নতুন কনটেন্ট খুঁজতেও জেমিনি ব্যবহার করতে পারেন।
তথ্যসূত্র: ওয়্যারড
গুগল ক্রোম ইনস্টল করার সময় উইন্ডোজ ব্যবহারকারীদের ‘এখনই নিরাপদে ব্রাউজ করুন’ লিখে সতর্ক করছে মাইক্রোসফট। কোম্পানিটির দাবি, ‘মাইক্রোসফট-এজ’ও ক্রোমের মতো একই প্রযুক্তিতে চলে, তবে এর সঙ্গে আছে মাইক্রোসফটের বিশ্বাসযোগ্যতা।
২ ঘণ্টা আগেঅ্যাপলের এয়ারপডসে যুক্ত হতে যাচ্ছে এক নতুন যুগান্তকারী ফিচার ‘লাইভ ট্রান্সলেশন’। এই ফিচারটি চালু থাকলে ফোনকলের পাশাপাশি সামনে থাকা ব্যক্তির কথাও অনুবাদ করে দেবে এয়ারপডসটি।
১০ ঘণ্টা আগেসাধারণ ছবিকে এবার সরাসরি থ্রিডি মডেলে রূপ দেওয়া যাবে। এমনই এক চমকপ্রদ প্রযুক্তি এনেছে মাইক্রোসফট। ‘কোপাইলট থ্রিডি’ নামের এই নতুন এআই টুলটি তৈরি করেছে কোপাইলট ল্যাবস। এর মাধ্যমে দ্বিমাত্রিক ইমেজ, পিএনজি বা জেপিজি ফরম্যাটের ১০ মেগাবাইটের নিচের যেকোনো ছবি দিয়ে তৈরি করা যাবে থ্রিডি মডেল।
১২ ঘণ্টা আগেকৃত্রিম বুদ্ধিমত্তা (এআই) ভিত্তিক চ্যাটজিপিটির পরামর্শ মেনে খাদ্যাভাস পরিবর্তন করায় নিউইয়র্কের ৬০ বছর বয়সী এক ব্যক্তি হাসপাতালে ভর্তি হন। চিকিৎসকদের মতে, কয়েক সপ্তাহের মধ্যে খাদ্যাভ্যাসে প্রায় সম্পূর্ণভাবে লবণ বাদ দিয়ে ফেলেন ওই ব্যক্তি, যার ফলে তার শরীরে বিপজ্জনকভাবে সোডিয়ামের ঘাটতি দেখা দেয়।
১৫ ঘণ্টা আগে