D-ID یک ابزار ترجمه ویدیوی هوش مصنوعی را راه اندازی می کند که شامل شبیه سازی صدا و همگام سازی لب است

D-ID یک ابزار ترجمه ویدیوی هوش مصنوعی را راه اندازی می کند که شامل شبیه سازی صدا و همگام سازی لب است پلتفرم ایجاد ویدیوی هوش مصنوعی D-ID آخرین شرکتی است که ابزاری را برای ترجمه ویدیوها به زبان های دیگر با استفاده از فناوری های هوش مصنوعی عرضه می کند.

با این حال، در این مورد، D-ID صدای گوینده را نیز شبیه سازی می کند و حرکات لب آنها را تغییر می دهد تا با کلمات ترجمه شده به عنوان بخشی از فرآیند ویرایش هوش مصنوعی مطابقت داشته باشد.

این فناوری از کارهای قبلی D-ID سرچشمه می گیرد – که ممکن است از روند ویروسی چند سال پیش به یاد بیاورید که در آن کاربران عکس های خانوادگی قدیمی خود را متحرک می کردند و بعدا آن عکس ها توانستند صحبت کنند.

با توجه به این موفقیت، این استارتاپ با 25 میلیون دلار در جمع آوری کمک های مالی سری B در سال 2022 با توجه به خدمات رسانی به تعداد فزاینده مشتریان سازمانی خود در ایالات متحده که از فناوری آن برای ساخت ویدیوهای مبتنی بر هوش مصنوعی استفاده می کردند، بسته شد.

با فناوری AI Video Translate که اکنون راه اندازی شده است، که در حال حاضر به مشترکین D-ID به صورت رایگان ارائه می شود، سازندگان می توانند به طور خودکار ویدیوهای خود را به زبان های دیگر ترجمه کنند تا به آنها کمک کنند دسترسی خود را گسترش دهند.

در مجموع، در حال حاضر 30 زبان از جمله عربی، ماندارین، ژاپنی، هندی، اسپانیایی و فرانسوی و غیره در دسترس است.

اشتراک D-ID از 56 دلار در سال برای ارزان ترین طرح و کمترین تعداد اعتبار برای استفاده برای ویژگی های هوش مصنوعی شروع می شود و سپس قبل از تغییر به قیمت گذاری سازمانی به 1,293 دلار در سال می رسد.

D-ID پیشنهاد می کند که فناوری جدید ویدیوی هوش مصنوعی می تواند به مشتریان کمک کند تا در هزینه های بومی سازی صرفه جویی کنند، هنگام مقیاس بندی کمپین های خود برای مخاطبان جهانی در زمینه هایی مانند بازاریابی، سرگرمی و رسانه های اجتماعی. این فناوری با راه حل های دیگر برای دوبله و ویدیوی هوش مصنوعی رقابت خواهد کرد.

برای سال ها، فناوری های دوبله گوش دادن به صدا به زبان خود را برای بینندگان ویدیو آسان تر کرده است، اما اغلب برای سازندگان کوچکتر غیرقابل دسترسی بود. با بهبود دسترسی شرکت ها به فناوری، این وضعیت در حال تغییر است.

به عنوان مثال، یوتیوب یک ویژگی صوتی چند زبانه منتشر کرد که برای کمک به سازندگان خود برای ارتباط با مخاطبان گسترده تری با ترجمه ویدیوهای خود به زبان های دیگر طراحی شده است. خالق مشهور MrBeast (جیمی دونالدسون) یکی از اولین پذیرندگان بود که از این فناوری برای آوردن چندین ویدیوی محبوب خود به 11 زبان دیگر استفاده کرد.

D-ID یک ابزار ترجمه ویدیوی هوش مصنوعی

D-ID یک ابزار ترجمه ویدیوی هوش مصنوعی

با هوش مصنوعی، توانایی ایجاد، ترجمه یا شبیه سازی صداها نیز در حال گسترش است. مایکروسافت امسال اعلام کرد که از هوش مصنوعی برای ترجمه و دوبله ویدیوهای یوتیوب و موارد دیگر در حین تماشا استفاده خواهد کرد.

در سال 2024 پلتفرم سازندگان Vimeo از ابزارهایی برای ترجمه صدا و زیرنویس ها و انجام این کار با تکرار صدای بلندگو با فناوری هوش مصنوعی رونمایی کرد.

بسیاری از شرکت ها همچنین ابزارهای شبیه سازی صدا یا ترجمه هوش مصنوعی (یا گاهی اوقات هر دو) را ارائه می دهند، از جمله ابزارهای Descript، ElevenLabs، Speechify، Veed، Camb.ai، Captions.ai و Akool، و همچنین ابزارهایی که به شما امکان می دهند با استفاده از آواتارهای هوش مصنوعی که می توانند ده ها زبان صحبت کنند، مانند HeyGen، Deepbrain AI و دیگران، ویدیوهایی ایجاد کنید.

کتابخانه های هوش مصنوعی دوبله و همگام سازی لب، مانند Wav2lip، ساخت این نوع ابزارها را برای استارت آپ ها آسان تر کرده است و در عین حال به سازندگان می گوید که استفاده از فناوری هوش مصنوعی را آسان تر و شاید مقرون به صرفه تر می کنند.

(مدل اختصاصی جدید توسعه یافته D-ID به نام Rosetta-1 AI Video Translate را تقویت می کند.)

برای امتحان این ابزار وارد شوید Video Translate – D-ID

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *