ডাল-ই এআই: এটি কী এবং এটি কীভাবে কাজ করে

 

ডাল-ই এআই: এটি কী এবং এটি কীভাবে কাজ করে



যখন জেনারেটিভ এআইয়ের কথা আসে, আপনি কি কখনও ভেবে দেখেছেন যে শব্দগুলি কীভাবে ছবিতে উত্পন্ন হয়? প্রক্রিয়া যার মাধ্যমে জেনারেটিভ এআই মডেলগুলি এমন একটি ধারণাটি কল্পনা করে যা আপনি কেবল মৌখিকভাবে প্রকাশ করেছেন, উদাহরণস্বরূপ। কৃত্রিম বুদ্ধিমত্তা (এআই) গবেষকরা পাঠ্য বিবরণ থেকে নির্ভরযোগ্যভাবে উচ্চমানের ছবি তৈরি করার উপায় খুঁজে পেতে কয়েক বছর ধরে লড়াই করেছেন। এই উদ্দেশ্যে, DALL-E তৈরি করা হয়। এই নিবন্ধে, আমরা ডাল-ই এর সুনির্দিষ্টকরণে ডুবে যাব যা ডেটা বিজ্ঞানের একটি বিষয়।

আপনি ভারতে ডেটা সায়েন্স কোর্সে ভর্তি হতে পারেন যা আপনার দক্ষতা বাড়িয়ে তুলতে পারে।

ডাল-ই কী

ডাল-ই একটি এআই সিস্টেম যা ব্যবহারকারীদের টেক্সট-টু-পিকচার নির্দেশাবলীতে সাড়া দিয়ে নতুন ছবি তৈরি করতে দেয়। ডাল-ই একটি নিউরাল নেটওয়ার্ক যা মানুষের ইনপুটের প্রতিক্রিয়া হিসাবে বিভিন্ন ধরণের শৈলীতে ব্র্যান্ড-নতুন ছবি তৈরি করার ক্ষমতা রাখে।

ডাল-ই শব্দটি কৃত্রিম বুদ্ধিমত্তার সাথে শৈল্পিক অভিব্যক্তিকে একত্রিত করার প্রযুক্তির উদ্দেশ্যকে নির্দেশ করে। প্রাথমিক অংশ (ডিএএলএল) এবং দ্বিতীয় অংশ (ই) উভয়ই পরাবাস্তববাদী স্প্যানিশ শিল্পী সালভাদর দালি এবং পৌরাণিক ডিজনি রোবট ওয়াল-ই যথাক্রমে উদ্দীপিত করার জন্য। দুটি শব্দ একসাথে মেশিন-স্বয়ংক্রিয় প্রযুক্তির বিমূর্ত এবং কিছুটা পরাবাস্তব চিত্রিত ক্ষমতা প্রকাশ করে।

কৃত্রিম বুদ্ধিমত্তা সরবরাহকারী ওপেনএআই ২০২১ সালের জানুয়ারিতে প্রথমবারের মতো ডাল-ই প্রকাশ করে। জিপিটি-৩ বড় ভাষা মডেলটি প্রযুক্তির গভীর শিক্ষার মডেলগুলির ভিত্তি হিসাবে কাজ করে, যা মূল ভিজ্যুয়াল সামগ্রী তৈরি করতে প্রাকৃতিক ভাষার আকারে ব্যবহারকারীর ইনপুট বিশ্লেষণ করে।

2020 সালের জুনে, ওপেনএআই একটি ধারণা চালু করেছিল যা তারা চিত্র জিপিটি বলে অভিহিত করেছিল যে কীভাবে একটি নিউরাল নেটওয়ার্ক তাজা উচ্চমানের ছবি তৈরি করতে ব্যবহৃত হতে পারে তা দেখানোর প্রচেষ্টা হিসাবে এবং ডাল-ই সেই ধারণার একটি সম্প্রসারণ। প্রাকৃতিক ভাষার পাঠ্য প্রম্পটের প্রতিক্রিয়া হিসাবে জিপিটি -3 কীভাবে নতুন শব্দ তৈরি করতে পারে তার অনুরূপ, ওপেনএআই ডাল-ই এর সাথে চিত্র জিপিটির মূল ধারণাটি প্রসারিত করতে সক্ষম হয়েছিল, ব্যবহারকারীদের একটি পাঠ্য প্রম্পট দিয়ে নতুন ছবি তৈরি করতে দেয়।

ডাল-ই কীভাবে কাজ করে

    1. ডাল-ই এর ফলাফল অর্জনের জন্য প্রাকৃতিক ভাষা প্রক্রিয়াকরণ (এনএলপি), বৃহত ভাষা মডেল (এলএলএম) এবং প্রসারণ প্রক্রিয়াকরণ ব্যবহার করে। ডাল-ই জিপিটি -3 এলএলএম এর একটি ছাঁটাই-ডাউন সংস্করণ ব্যবহার করে একত্রিত হয়েছিল। ডাল-ই, যা ছবি উত্পাদনের জন্য অপ্টিমাইজ করার জন্য তৈরি করা হয়েছিল, জিপিটি -3 এর পুরো 175 বিলিয়নের পরিবর্তে মাত্র 12 বিলিয়ন পরামিতি নিয়োগ করে। ডাল-ই, জিপিটি -3 এলএলএমের মতো, ধারণাগত লিঙ্কগুলির প্রজন্ম এবং বোঝার সুবিধার্থে একটি ট্রান্সফরমার নিউরাল নেটওয়ার্ক নিয়োগ করে, কখনও কখনও "ট্রান্সফরমার" এ সংক্ষিপ্ত করা হয়। ডাল-ই এর অন্তর্নিহিত প্রযুক্তি, জিরো-শট টেক্সট-টু-ইমেজ জেনারেশন, ২০২১ সালের ফেব্রুয়ারিতে ওপেন এআই দ্বারা প্রকাশিত ২০ পৃষ্ঠার শ্বেতপত্রে প্রথম বর্ণনা করা হয়েছিল। কৃত্রিম বুদ্ধিমত্তার জিরো শট পদ্ধতি একটি মডেলকে তার নিজস্ব সঞ্চিত জ্ঞান এবং সম্পর্কিত ধারণাগুলি অঙ্কন করে একটি নতুন ছবি তৈরি করার মতো কোনও ক্রিয়া সম্পাদন করতে দেয়।
    2. ওপেন এআই সিএলআইপি (কনট্রাকটিভ ল্যাঙ্গুয়েজ-ইমেজ প্রি-ট্রেনিং) মডেলটিও তৈরি করেছে, যা ৪০০ মিলিয়ন লেবেলযুক্ত ছবির উপর প্রশিক্ষণ দেওয়া হয়েছিল, এটি প্রদর্শন করার জন্য যে ডাল-ই মডেলটি সঠিকভাবে চিত্র তৈরি করতে পারে। ওপেনএআই একটি সিন্থেটিক ছবির জন্য সর্বোত্তম ক্যাপশন নির্ধারণ করে ডাল-ই এর আউটপুট মূল্যায়নে সহায়তা করতে ক্লিপ ব্যবহার করেছে। ডাল-ই (ডাল-ই 1) এর প্রথম সংস্করণটি পাঠ্যের ভিজ্যুয়াল উপস্থাপনা তৈরি করতে একটি বিচক্ষণ ভেরিয়েশনাল অটো-এনকোডার (ডিভিএই) ব্যবহার করেছিল, যা ভেক্টর কোয়ান্টাইজড ভেরিয়েশনাল অটো-এনকোডারের সাথে বর্ণমালার ডিপমাইন্ড বিভাগের কাজ দ্বারা অনুপ্রাণিত হয়েছিল। ডাল-ই 2 মূলটির একটি আপগ্রেড, উচ্চমানের, ফটোরিয়ালিস্টিক ফটোগ্রাফ তৈরি করতে সক্ষম। ডাল-ই 2 এর মূল বৈশিষ্ট্যগুলির মধ্যে একটি হ'ল একটি ব্যাপন মডেল যা একটি উচ্চতর চূড়ান্ত পণ্য উত্পাদন করতে সিএলআইপি মডেল থেকে তথ্য ব্যবহার করে।

শিল্পে ডাল-ই এর ব্যবহার

ডাল-ই হ'ল বেশ কয়েকটি অ্যাপ্লিকেশন সহ একটি জেনারেটিভ এআই প্রযুক্তি যা মানুষ এবং ব্যবসায় উভয়কেই উপকৃত করতে পারে:

    1. সৃজনশীল অনুপ্রেরণা - প্রযুক্তি সৃজনশীলতাকে উত্সাহিত করতে পারে। এটি একটি সৃজনশীল প্রক্রিয়াও বাড়িয়ে তুলতে পারে।
    2. বিনোদন - বই এবং গেমগুলি ডাল-ই এর চিত্রগুলি ব্যবহার করতে পারে। ডাল-ই এর প্রম্পট প্রক্রিয়া গ্রাফিক্স তৈরি সিজিআইয়ের চেয়ে সহজ করে তোলে।
    3. শিক্ষা - ডাল-ই শিক্ষকদের বিষয়গুলি চিত্রিত করতে সহায়তা করে।
    4. বিপণন এবং বিজ্ঞাপন - বিজ্ঞাপন এবং বিপণন স্বতন্ত্র চিত্র তৈরি থেকে উপকৃত হয়।
    5. পণ্য ডিজাইন - ডাল-ই এর পাঠ্য-ভিত্তিক ভিজ্যুয়ালাইজেশন পণ্য ডিজাইনারদের জন্য সিএডির চেয়ে দ্রুত হতে পারে।
    6. - শিল্প - যে কেউ উপভোগ এবং প্রদর্শনের জন্য শিল্প তৈরি করতে ডাল-ই ব্যবহার করতে পারে।
    7. - ফ্যাশন ডিজাইন - ডাল-ই ফ্যাশন ডিজাইনারদের বর্তমান সরঞ্জামগুলির পরিপূরক করে নতুন পণ্য তৈরি করতে সহায়তা করতে পারে।

ডাল-ই সাধারণত কত খরচ করে

যে কেউ ডাল-ই ব্যবহার করতে পারে তবে বিকাশকারীদের কাছে এপিআইয়ের মাধ্যমে এটি তাদের নিজস্ব পণ্যগুলিতে অন্তর্ভুক্ত করার বিকল্পও রয়েছে। ওপেনএআই ওয়েবসাইটের মাধ্যমে প্ল্যাটফর্মটি অ্যাক্সেস করা ডাল-ই ব্যবহারকারীরা এখন একটি অন্তর্নির্মিত ক্রেডিট সিস্টেম ব্যবহার করতে পারেন। ডাল-ই এর প্রাথমিক ব্যবহারকারীরা যারা 6 এপ্রিল, 2023 এর আগে যোগদান করেছিলেন, তারা এখন বিনামূল্যে ক্রেডিটের জন্য যোগ্য।

এই বোনাস তহবিলগুলি প্রতি মাসে পুনর্নবীকরণ করা হয় এবং পুরষ্কার পাওয়ার পরে এগুলি কেবল এক মাসের জন্য ভাল। প্রতিবার আপনি যখন ডাল-ইকে কোনও ছবি তৈরি বা সংশোধন করতে বলবেন, আপনাকে একটি ক্রেডিট ব্যয় করতে হবে। ক্রেডিট নতুন ব্যবহারকারীদের দ্বারা কেনা যেতে পারে। 2023 সালের এপ্রিলে, $ 115 আপনি 115 ক্রেডিট পাবেন। সমস্ত কেনা ক্রেডিট এক বছর পরে হারিয়ে যাবে।

ওপেনএআই এপিআই ব্যবহার করে ডেভেলপারদের প্রতি চিত্র ফি চার্জ করে। ছবির মাত্রার জন্য মূল্য সামঞ্জস্য করা হয়। 2023 সালের এপ্রিলে, প্রতি ছবির দাম ছিল 256x256 পিক্সেলের জন্য 0.016 ডলার, 512x512 পিক্সেলের জন্য 0.018 ডলার এবং 1024x1024 পিক্সেলের জন্য 0.020 ডলার।

পাঠ্য বিবরণ থেকে খুব বাস্তবসম্মত এবং বিশদ ছবি তৈরি করার ক্ষমতার ফলস্বরূপ, ডিএএল-ই 2 জেনারেটিভ এআইয়ের ক্ষেত্রে একটি বড় অগ্রগতি। সিএলআইপি এনকোডিং, ব্যাপন মডেল এবং পোস্ট-প্রসেসিং পদ্ধতিগুলির শক্তি ডিএএল-ই 2 কে এমন ভিজ্যুয়াল তৈরি করতে দেয় যা অর্থ এবং উদ্দেশ্য অনুসারে মূল পাঠ্যের প্রতি বিশ্বস্ত।

আমরা ভবিষ্যতে ডিএএল-ই 2 এর মতো মডেলগুলির আরও আশ্চর্যজনক এবং ফলস্বরূপ ব্যবহারের প্রত্যাশা করতে পারি কারণ গভীর শেখার কাঠামো এবং কম্পিউটিং সংস্থানগুলি বিকাশ অব্যাহত রয়েছে। ডিএএল-ই 2 এর ধারণা এবং পদ্ধতি সম্পর্কে শেখা ডেটা বিজ্ঞানী এবং এআই ভক্তদের জেনারেটিভ এআইয়ের সম্পূর্ণ সম্ভাবনা উপলব্ধি করতে সহায়তা করবে।

সেরা অনলাইন ডেটা সায়েন্স কোর্সগুলি এই বিষয়ে আরও ভাল ধারণা পেতে সহায়ক হতে পারে।

dolalbhuiyan

entrepreneur

একটি মন্তব্য পোস্ট করুন

নবীনতর পূর্বতন