شرکت ElevenLabs بهتازگی سرویس مبتنی بر هوش مصنوعی خود را ارتقا داده است تا کاربران بتوانند با دستور متنی، جلوه صوتی بسازند.
بهنظر میرسد هوش مصنوعی در حوزه تولید محتوای صوتی، درحال ورود به عصر جدیدی است. نرمافزار شرکت ElevenLabs صداهای انسان و موسیقیهای تولیدشده توسط هوش مصنوعی ارائه میدهد. حالا این AI، به کاربران امکان میدهد تا جلوههای صوتی را برای پادکستها، فیلمها یا بازیها نیز ایجاد کنند.
به گزارش TheVerge، این ابزار جدید میتواند تا 22 ثانیه صدا را براساس درخواستهای کاربر تولید کند که این صدا قابل ترکیب با پلتفرمهای صوتی و موسیقی شرکتهای دیگر است. همچنین پس از اتمام کار، این سرویس حداقل چهار نوع فایل صوتی قابل دانلود را در اختیار کاربران قرار میدهد.
ElevenLabs اعلام کرد که با پلتفرم Shutterstock برای ساخت یک پایگاه داده و آموزش این مدل هوش مصنوعی کار کرده است. Shutterstock قبلاً مجوز پایگاه داده محتوای خود را به بسیاری از شرکتهای فعال در AI ازجمله متا، OpenAI و گوگل داده است.
استفاده از جلوههای صوتی سرویس هوش مصنوعی ElevenLabs رایگان است، اما کاربران اشتراکی میتوانند از کلیپهای صوتی تولیدشده با مجوزهای تجاری استفاده کنند؛ درحالیکه کاربران رایگان باید عنوان «elevenlabs.io» را در عنوان محتوای خود قرار دهند. همچنین این کاربران، محدودیت کاراکتر در هنگام نوشتن پرامپتها را دارند و مجاز به استفاده از 10,000 کاراکتر در ماه هستند.
بیشتر بخوانید
در بازار سرویسهای مختلفی برای ارائه جلوههای صوتی به فیلمسازان و بازیسازان وجود دارد، اما گاهی اوقات این سرویسها گران یا در پخش صدا با مشکل مواجه هستند.
ElevenLabs در سایت خود میگوید که این مدل هوش مصنوعی را «برای تولید صداهای غنی، همهجانبه، سریع، مقرونبهصرفه و در مقیاس بزرگ» طراحی کرده است.
سایر توسعهدهندگان AI نیز درحال توسعه چنین سرویسی هستند. شرکت Stability AI سال گذشته سرویس Stable Audio را منتشر کرد که جلوههای صوتی ایجاد میکند. همچنین مدلهای AudioCraft شرکت متا نیز صداهای پسزمینه طبیعی مثل صدای باد یا ترافیک تولید میکند.