অনিন্দ্য চৌধুরী অর্ণব
রাজনীতি থেকে বিনোদন জগৎ—সবখানে এখন আলোচনায় ডিপফেক প্রযুক্তি। তবে সাম্প্রতিক সময়ে বিনোদন জগতে সবচেয়ে আলোচিত প্রযুক্তি এটি। ডিপফেক সত্যকে পুঁজি করে সৃষ্টি করা এক অভাবনীয় মিথ্যা-প্রতারণা। আর এই প্রতারণায় বেশির ভাগ ভুক্তভোগী বিখ্যাত ব্যক্তি, রাজনৈতিক নেতৃত্ব ও বিনোদন তারকা।
ফেসবুক, ইনস্টাগ্রামে শেয়ার করা ছবি, ভিডিও ইত্যাদি সংগ্রহ করে সেখান থেকে ডিপফেক প্রযুক্তির মাধ্যমে তৈরি করা হয় অন্য ধরনের ছবি বা ভিডিও। এর অধিকাংশই হয়ে থাকে ব্ল্যাকমেলিং বা অন্য কোনো অসৎ উদ্দেশ্যে। ফটোশপ কিংবা অন্যান্য এডিটিং সফটওয়্যারের সাহায্যে কেবল নিখুঁতভাবে ছবি এডিট করা গেলেও এখন প্রযুক্তির উৎকর্ষে ভিডিও এডিট করা যায় নিখুঁতভাবে, দ্রুততার সঙ্গে।
মানুষের দৃষ্টির পর্যায়কাল শূন্য দশমিক ১ সেকেন্ড বা ১০০ মিলি সেকেন্ড; অর্থাৎ এর চেয়ে কম সময়ে ঘটে যাওয়া কোনো দৃশ্যপট চোখে ধরা পড়বে না। আর ডিপফেক ভিডিও তৈরির মূল ফাঁকিটুকু এখানেই। কৃত্রিম বুদ্ধিমত্তা দিয়ে তৈরি করা এসব ভিডিওতে নানান ধরনের রূপান্তর ঘটে ১০০ মিলি সেকেন্ডেরও কম সময়ে। তাই খালি চোখে আসল-নকলের পার্থক্য বোঝা হয়ে পড়ে মুশকিল। ডিপফেক মূলত কৃত্রিম বুদ্ধিমত্তা প্রযুক্তি প্রয়োগে সমন্বয়কৃত নকল বিষয়বস্তু। সেটা হতে পারে ছবি, অডিও-ভিডিও বা অ্যানিমেশন প্রভৃতি।
প্রায় ৭০০ বছর আগে, ১৯৯৭ সালে একটি গবেষণাপত্রকে ভিত্তি করে তৈরি হয় একটি অ্যালগরিদম। যদিও তখন এর কোনো নাম ছিল না। ব্রেগলার, কোভেল ও স্লানি এই তিনজনের গবেষণার বিষয় ছিল ‘ভিডিও রিরাইট: ড্রাইভিং ভিজ্যুয়াল স্পিচ উইথ অডিও’; অর্থাৎ অডিও সংশোধন। বিদ্যমান ভিডিও ফুটেজ ঠিক রেখে স্বয়ংক্রিয়ভাবে একজন ব্যক্তির নকল কণ্ঠস্বর দেওয়া। দেখে মনেই হবে না যে ব্যক্তিটির কণ্ঠ নকল। অথচ ভিডিওতে তা বলেননি। নকল ভয়েসের সঙ্গে তাল রেখে কেবল ঠোঁট নাড়ানোর মাধ্যমেই কাজটি করা হয়েছিল। ‘লিপসিঙ্ক’ শব্দটি এখানে সার্থক। যদিও ব্রেগলারদের এই প্রকল্পের মূল প্রস্তাবনা ছিল চলচ্চিত্রে কণ্ঠারোপ সহজ করা। তাই ডিপফেকের একক কোনো উদ্ভাবক নেই। বিভিন্ন হাত ঘুরে ধারণাটি উঠে এসেছে। ২০১৪ সালে এসে এর পরিপূর্ণ রূপদান করেছেন ইয়ন গুডফেলো। তাঁর তৈরি করা জেনারেটিভ অ্যাডভারসিয়াল নেটওয়ার্ক বা গানই ডিপফেক প্রযুক্তির মূল চাবিকাঠি।
ডিপফেক মূলত অডিও-ভিডিওর নকল প্রতিরূপ, যা প্রথম দর্শনে সত্য বলে মনে হয়। মেশিন লার্নিং এই প্রতিরূপ তৈরির প্রধান হাতিয়ার। এর একটি কৌশলের নাম ‘জেনারেল অ্যাডভারসেরিয়াল নেটওয়ার্ক’ বা গান। এর মাধ্যমে প্রথমত একজন ব্যক্তির হাজারখানেক অভিব্যক্তির ছবি সংগ্রহ করে বিন্যস্ত করা হয় স্বয়ংক্রিয়ভাবে। প্রস্তুত করা হয় ভিডিও সিমুলেশন। এর সঙ্গে জুড়ে দেওয়া হয় অডিও।
ডিপফেকের আরেক সহোদর ভাই রয়েছে। তার নাম শ্যালোফেক। ডিপফেকের তুলনায় এটি বানানো সহজ। এই প্রযুক্তিতে মূলত ভিডিও স্পিড ইফেক্ট ব্যবহার হয়। অস্বাভাবিক গতি ব্যক্তির অভিব্যক্তি পরিবর্তন করে দেয়। ভিডিও স্পিড কমালে মনে হয় মাতাল নয়তো প্রতিবন্ধী। গতি বাড়ালে ব্যক্তিকে আক্রমণাত্মক দেখাবে। একে ডাম্বফেকও বলা হয়।
পুরো প্রক্রিয়া শেষ করতে ব্যবহার করা হয় দুটি ভিন্ন ধরনের অ্যালগরিদম। প্রথম অ্যালগরিদমটি ছবি, অডিও-ভিডিও ইত্যাদি জেনারেট করার কাজটি করে। অন্য অ্যালগরিদমটি তৈরি করা প্রতিরূপের পার্থক্য খুঁজে বের করতে সহযোগিতা করে। নির্ণয় করে বিভিন্ন ব্যবধান। কপালের ভাঁজ, মুখের খাঁজ ইত্যাদি কোনটি কোথায় কেমন হবে, সেগুলোও সঠিকভাবে নিশ্চিত করতে সহযোগিতা করে, ঠিক যতক্ষণ না নকলটি পুরোপুরি আসলের মতো হচ্ছে।
নকল ভিডিও বা অডিওতে থাকা স্বর হুবহু আসল ব্যক্তির মতো হতে হবে বলে কণ্ঠস্বরের ক্ষেত্রে নেওয়া হয় ভিন্ন কৌশল। এর জন্য আসল ব্যক্তির সত্যিকার স্বরের সত্যিকার নমুনা সংগ্রহ করতে হয়। তারপর তা ইনপুট করা হয় এআই নমুনায়। তারপর কৃত্রিম বুদ্ধিমত্তা স্বরটি নিয়ে পাখির মতো কিচিরমিচির শব্দে বিশ্লেষণ করবে। প্রকৃত স্বরের কাছাকাছি হলেই থামিয়ে দেবে। প্রদান করবে স্বয়ংক্রিয় নির্দেশনা।
প্রযুক্তিটি মজার হলেও বিষয়টি মোটেও মজার নয়। সম্ভবত এআই উদ্ভাবিত সবচেয়ে ভয়ানক প্রযুক্তি এটি। এর কারণে অশ্লীলতায় পূর্ণ সব কনটেন্ট ভাইরাসের মতো দ্রুত ছড়িয়ে যাচ্ছে প্রতিদিন। সাধারণ মানুষ থেকে প্রেসিডেন্ট পর্যন্ত বাদ যায়নি কেউ। মার্কিন প্রেসিডেন্ট বারাক ওবামা ছাড়াও ৪৫তম প্রেসিডেন্ট ট্রাম্প ক্ষমতায় থাকা অবস্থাতেই তাঁর ডিপফেক ভিডিও ছড়িয়ে পড়ে। সেই নকল ভিডিওতে প্রেসিডেন্ট ট্রাম্প প্যারিস জলবায়ু চুক্তি-সম্পর্কিত সদস্যপদ নিয়ে বেলজিয়ামকে উপহাস করেন। ফেসবুকের প্রতিষ্ঠাতা মার্ক জাকারবার্গ, জনপ্রিয় কমেডিয়ান মিস্টার বিনসহ বহু অভিনেতা-অভিনেত্রী এর উদাহরণ। এই প্রযুক্তিতে তৈরি কনটেন্ট নিয়ে উদ্বিগ্ন অমিতাভ বচ্চন।
ডিপফেক কনটেন্টের অধিকাংশ হয় ভিডিও। খালি চোখে ডিপফেক কি না, তা শনাক্ত একপলকে সম্ভব না হলেও গভীর নজরে এখন পর্যন্ত তা ধরা যায়। চোখের পাতা ওঠানামার সময়ের পার্থক্য, মুখভঙ্গির ভিন্নতা, শারীরিক অঙ্গভঙ্গি, কথার গতি, কণ্ঠের নমনীয়তা-কঠোরতা, ঠোঁটের নড়ন তুলনামূলক কম-বেশি, চুলের রং ইত্যাদি মৌলিক কিছু বিষয় নজরে রেখে সহজেই আসল-নকল পার্থক্য করা যেতে পারে। এগুলোতেও ধরা না গেলে একটু গভীরে ভাবতে হবে কনটেন্টের আলো-ছায়ার খেলা নিয়ে। পটভূমিতে থাকা বিষয়বস্তুর চেয়ে মূল বিষয়বস্তু ঝাপসা না স্পষ্ট, সেটা বুঝতে হবে।
ডিপফেকে তৈরি করা অডিও-ভিডিও শনাক্ত করার জন্য কিছু সফটওয়্যার আছে। সেগুলোর মধ্যে ডিপট্রেস, ভিডিও ইনভিড সফটওয়্যার, রিভার্স ইমেজ সার্চ, ভিডিও মেটাডেটা, ফটো মেটাডেটা, অ্যামনেস্টি ইন্টারন্যাশনালের ইউটিউব ডেটা ভিউয়ার, জার্মানির মিউনিখ বিশ্ববিদ্যালয়ের ভিজ্যুয়াল কম্পিউটিং ল্যাবের গবেষক দলের ফেস-ফরেনসিক সফটওয়্যার অন্যতম।
প্রযুক্তি প্রতিনিয়ত নতুন নতুন দুয়ার খুলছে। প্রযুক্তির নেতিবাচক ব্যবহারের বিপরীতে উন্মোচিত হচ্ছে উপযোগী প্রযুক্তিও। তাই আশা করা যায়, দ্রুতই ডিপফেক সমস্যা সমাধানে যুগান্তকারী কোনো প্রযুক্তি আসবে।
রাজনীতি থেকে বিনোদন জগৎ—সবখানে এখন আলোচনায় ডিপফেক প্রযুক্তি। তবে সাম্প্রতিক সময়ে বিনোদন জগতে সবচেয়ে আলোচিত প্রযুক্তি এটি। ডিপফেক সত্যকে পুঁজি করে সৃষ্টি করা এক অভাবনীয় মিথ্যা-প্রতারণা। আর এই প্রতারণায় বেশির ভাগ ভুক্তভোগী বিখ্যাত ব্যক্তি, রাজনৈতিক নেতৃত্ব ও বিনোদন তারকা।
ফেসবুক, ইনস্টাগ্রামে শেয়ার করা ছবি, ভিডিও ইত্যাদি সংগ্রহ করে সেখান থেকে ডিপফেক প্রযুক্তির মাধ্যমে তৈরি করা হয় অন্য ধরনের ছবি বা ভিডিও। এর অধিকাংশই হয়ে থাকে ব্ল্যাকমেলিং বা অন্য কোনো অসৎ উদ্দেশ্যে। ফটোশপ কিংবা অন্যান্য এডিটিং সফটওয়্যারের সাহায্যে কেবল নিখুঁতভাবে ছবি এডিট করা গেলেও এখন প্রযুক্তির উৎকর্ষে ভিডিও এডিট করা যায় নিখুঁতভাবে, দ্রুততার সঙ্গে।
মানুষের দৃষ্টির পর্যায়কাল শূন্য দশমিক ১ সেকেন্ড বা ১০০ মিলি সেকেন্ড; অর্থাৎ এর চেয়ে কম সময়ে ঘটে যাওয়া কোনো দৃশ্যপট চোখে ধরা পড়বে না। আর ডিপফেক ভিডিও তৈরির মূল ফাঁকিটুকু এখানেই। কৃত্রিম বুদ্ধিমত্তা দিয়ে তৈরি করা এসব ভিডিওতে নানান ধরনের রূপান্তর ঘটে ১০০ মিলি সেকেন্ডেরও কম সময়ে। তাই খালি চোখে আসল-নকলের পার্থক্য বোঝা হয়ে পড়ে মুশকিল। ডিপফেক মূলত কৃত্রিম বুদ্ধিমত্তা প্রযুক্তি প্রয়োগে সমন্বয়কৃত নকল বিষয়বস্তু। সেটা হতে পারে ছবি, অডিও-ভিডিও বা অ্যানিমেশন প্রভৃতি।
প্রায় ৭০০ বছর আগে, ১৯৯৭ সালে একটি গবেষণাপত্রকে ভিত্তি করে তৈরি হয় একটি অ্যালগরিদম। যদিও তখন এর কোনো নাম ছিল না। ব্রেগলার, কোভেল ও স্লানি এই তিনজনের গবেষণার বিষয় ছিল ‘ভিডিও রিরাইট: ড্রাইভিং ভিজ্যুয়াল স্পিচ উইথ অডিও’; অর্থাৎ অডিও সংশোধন। বিদ্যমান ভিডিও ফুটেজ ঠিক রেখে স্বয়ংক্রিয়ভাবে একজন ব্যক্তির নকল কণ্ঠস্বর দেওয়া। দেখে মনেই হবে না যে ব্যক্তিটির কণ্ঠ নকল। অথচ ভিডিওতে তা বলেননি। নকল ভয়েসের সঙ্গে তাল রেখে কেবল ঠোঁট নাড়ানোর মাধ্যমেই কাজটি করা হয়েছিল। ‘লিপসিঙ্ক’ শব্দটি এখানে সার্থক। যদিও ব্রেগলারদের এই প্রকল্পের মূল প্রস্তাবনা ছিল চলচ্চিত্রে কণ্ঠারোপ সহজ করা। তাই ডিপফেকের একক কোনো উদ্ভাবক নেই। বিভিন্ন হাত ঘুরে ধারণাটি উঠে এসেছে। ২০১৪ সালে এসে এর পরিপূর্ণ রূপদান করেছেন ইয়ন গুডফেলো। তাঁর তৈরি করা জেনারেটিভ অ্যাডভারসিয়াল নেটওয়ার্ক বা গানই ডিপফেক প্রযুক্তির মূল চাবিকাঠি।
ডিপফেক মূলত অডিও-ভিডিওর নকল প্রতিরূপ, যা প্রথম দর্শনে সত্য বলে মনে হয়। মেশিন লার্নিং এই প্রতিরূপ তৈরির প্রধান হাতিয়ার। এর একটি কৌশলের নাম ‘জেনারেল অ্যাডভারসেরিয়াল নেটওয়ার্ক’ বা গান। এর মাধ্যমে প্রথমত একজন ব্যক্তির হাজারখানেক অভিব্যক্তির ছবি সংগ্রহ করে বিন্যস্ত করা হয় স্বয়ংক্রিয়ভাবে। প্রস্তুত করা হয় ভিডিও সিমুলেশন। এর সঙ্গে জুড়ে দেওয়া হয় অডিও।
ডিপফেকের আরেক সহোদর ভাই রয়েছে। তার নাম শ্যালোফেক। ডিপফেকের তুলনায় এটি বানানো সহজ। এই প্রযুক্তিতে মূলত ভিডিও স্পিড ইফেক্ট ব্যবহার হয়। অস্বাভাবিক গতি ব্যক্তির অভিব্যক্তি পরিবর্তন করে দেয়। ভিডিও স্পিড কমালে মনে হয় মাতাল নয়তো প্রতিবন্ধী। গতি বাড়ালে ব্যক্তিকে আক্রমণাত্মক দেখাবে। একে ডাম্বফেকও বলা হয়।
পুরো প্রক্রিয়া শেষ করতে ব্যবহার করা হয় দুটি ভিন্ন ধরনের অ্যালগরিদম। প্রথম অ্যালগরিদমটি ছবি, অডিও-ভিডিও ইত্যাদি জেনারেট করার কাজটি করে। অন্য অ্যালগরিদমটি তৈরি করা প্রতিরূপের পার্থক্য খুঁজে বের করতে সহযোগিতা করে। নির্ণয় করে বিভিন্ন ব্যবধান। কপালের ভাঁজ, মুখের খাঁজ ইত্যাদি কোনটি কোথায় কেমন হবে, সেগুলোও সঠিকভাবে নিশ্চিত করতে সহযোগিতা করে, ঠিক যতক্ষণ না নকলটি পুরোপুরি আসলের মতো হচ্ছে।
নকল ভিডিও বা অডিওতে থাকা স্বর হুবহু আসল ব্যক্তির মতো হতে হবে বলে কণ্ঠস্বরের ক্ষেত্রে নেওয়া হয় ভিন্ন কৌশল। এর জন্য আসল ব্যক্তির সত্যিকার স্বরের সত্যিকার নমুনা সংগ্রহ করতে হয়। তারপর তা ইনপুট করা হয় এআই নমুনায়। তারপর কৃত্রিম বুদ্ধিমত্তা স্বরটি নিয়ে পাখির মতো কিচিরমিচির শব্দে বিশ্লেষণ করবে। প্রকৃত স্বরের কাছাকাছি হলেই থামিয়ে দেবে। প্রদান করবে স্বয়ংক্রিয় নির্দেশনা।
প্রযুক্তিটি মজার হলেও বিষয়টি মোটেও মজার নয়। সম্ভবত এআই উদ্ভাবিত সবচেয়ে ভয়ানক প্রযুক্তি এটি। এর কারণে অশ্লীলতায় পূর্ণ সব কনটেন্ট ভাইরাসের মতো দ্রুত ছড়িয়ে যাচ্ছে প্রতিদিন। সাধারণ মানুষ থেকে প্রেসিডেন্ট পর্যন্ত বাদ যায়নি কেউ। মার্কিন প্রেসিডেন্ট বারাক ওবামা ছাড়াও ৪৫তম প্রেসিডেন্ট ট্রাম্প ক্ষমতায় থাকা অবস্থাতেই তাঁর ডিপফেক ভিডিও ছড়িয়ে পড়ে। সেই নকল ভিডিওতে প্রেসিডেন্ট ট্রাম্প প্যারিস জলবায়ু চুক্তি-সম্পর্কিত সদস্যপদ নিয়ে বেলজিয়ামকে উপহাস করেন। ফেসবুকের প্রতিষ্ঠাতা মার্ক জাকারবার্গ, জনপ্রিয় কমেডিয়ান মিস্টার বিনসহ বহু অভিনেতা-অভিনেত্রী এর উদাহরণ। এই প্রযুক্তিতে তৈরি কনটেন্ট নিয়ে উদ্বিগ্ন অমিতাভ বচ্চন।
ডিপফেক কনটেন্টের অধিকাংশ হয় ভিডিও। খালি চোখে ডিপফেক কি না, তা শনাক্ত একপলকে সম্ভব না হলেও গভীর নজরে এখন পর্যন্ত তা ধরা যায়। চোখের পাতা ওঠানামার সময়ের পার্থক্য, মুখভঙ্গির ভিন্নতা, শারীরিক অঙ্গভঙ্গি, কথার গতি, কণ্ঠের নমনীয়তা-কঠোরতা, ঠোঁটের নড়ন তুলনামূলক কম-বেশি, চুলের রং ইত্যাদি মৌলিক কিছু বিষয় নজরে রেখে সহজেই আসল-নকল পার্থক্য করা যেতে পারে। এগুলোতেও ধরা না গেলে একটু গভীরে ভাবতে হবে কনটেন্টের আলো-ছায়ার খেলা নিয়ে। পটভূমিতে থাকা বিষয়বস্তুর চেয়ে মূল বিষয়বস্তু ঝাপসা না স্পষ্ট, সেটা বুঝতে হবে।
ডিপফেকে তৈরি করা অডিও-ভিডিও শনাক্ত করার জন্য কিছু সফটওয়্যার আছে। সেগুলোর মধ্যে ডিপট্রেস, ভিডিও ইনভিড সফটওয়্যার, রিভার্স ইমেজ সার্চ, ভিডিও মেটাডেটা, ফটো মেটাডেটা, অ্যামনেস্টি ইন্টারন্যাশনালের ইউটিউব ডেটা ভিউয়ার, জার্মানির মিউনিখ বিশ্ববিদ্যালয়ের ভিজ্যুয়াল কম্পিউটিং ল্যাবের গবেষক দলের ফেস-ফরেনসিক সফটওয়্যার অন্যতম।
প্রযুক্তি প্রতিনিয়ত নতুন নতুন দুয়ার খুলছে। প্রযুক্তির নেতিবাচক ব্যবহারের বিপরীতে উন্মোচিত হচ্ছে উপযোগী প্রযুক্তিও। তাই আশা করা যায়, দ্রুতই ডিপফেক সমস্যা সমাধানে যুগান্তকারী কোনো প্রযুক্তি আসবে।
কাজাখস্তানের ২৩ বছর বয়সী তরুণ কেনজেবেক ইসমাইলভ তাঁর মাকে নিয়ে হাসপাতালে যাচ্ছিলেন। পথে একটি গাড়ি কোনো কারণ ছাড়াই থেমে গিয়ে এক লেনের রাস্তায় যানজট সৃষ্টি করে। কিন্তু কেনজেবেকের হাসপাতালে যাওয়ার তাড়া ছিল।
৯ ঘণ্টা আগেব্যবহারকারীদের কথা মাথায় রেখে নতুন নতুন প্রযুক্তি যুক্ত করছে স্মার্টফোনের ব্র্যান্ডগুলো। টেকসই ও স্থায়িত্বের নিশ্চয়তা দিতে যুক্ত করা হচ্ছে এসব প্রযুক্তি। একই সঙ্গে দেখার সৌন্দর্যের জন্য গুরুত্ব পাচ্ছে ফোনের রং ও অন্যান্য বাহ্যিক ডিজাইনও। সম্প্রতি দেশের বাজারে আসা এমন একটি স্মার্টফোন হলো রিয়েলমি সি৭৫
১২ ঘণ্টা আগেকৃত্রিম বুদ্ধিমত্তার (এআই) ক্ষমতা নিয়ে বড় পরিকল্পনার কথা জানালেন মেটার প্রধান নির্বাহী মার্ক জাকারবার্গ। মেটার প্রথম এআই ডেভেলপার সম্মেলন ‘লামাকন’-এর সমাপনী অধিবেশনে মাইক্রোসফটের সিইও সত্য নাদেলার সঙ্গে এক বিশেষ সাক্ষাৎকারে জাকারবার্গ বলেন, ‘আমাদের ধারণা, আগামী এক বছরের মধ্যেই মেটার অর্ধেক সফটওয়্যার
১২ ঘণ্টা আগেআগে কখনো প্রেমে পড়েননি চীনের নাগরিক স্টিভ চেন (২৫)। তবে গত বসন্তে নিজের প্রথম প্রেম খুঁজে পান তিনি। তাও আবার লাইভ ভিডিও চ্যাটের মাধ্যমে। শুধু চ্যান না, ভিডিও চ্যাটরুমে বর্তমানে প্রেম খুঁজছেন চীনের বহু তরুণ। সেখানে ‘সাইবার ম্যাচমেকার’ পরিচালনা করেন ডেটিং সেশন, আর হাজারো মানুষ তা সরাসরি দেখেন...
১৩ ঘণ্টা আগে