• ارتباط با ما
  • درباره ما
  • خرید جدیدترین نشریات
آبان ۲۲, ۱۴۰۴
mozaffariehonline
  • صفحه نخست
  • اجتماعی
  • ورزشی
  • اقتصادی
  • فرهنگی و هنری
  • سیاسی
  • بین الملل
  • تحریریه
  • چندرسانه‌ای
    • عکس
    • فیلم
    • موشن گرافی
mozaffariehonline
  • صفحه نخست
  • اجتماعی
  • ورزشی
  • اقتصادی
  • فرهنگی و هنری
  • سیاسی
  • بین الملل
  • تحریریه
  • چندرسانه‌ای
    • عکس
    • فیلم
    • موشن گرافی

برای جستجو تایپ کرده و Enter را بزنید

مدل زبانی جدید اپل می‌تواند با سرعتی خیره‌کننده متون طولانی تولید کند

مدل زبانی جدید اپل با بهره‌گیری از معماری پیشرفته قادر است متن‌های بلند و پیچیده را با سرعتی فوق‌العاده و دقت بالا تولید کند. براساس گزارش‌ها، تیم تحقیقاتی اپل یک مدل مبتنی بر Diffusion ارائه کرده است که می‌تواند متن‌ها را تا ۱۲۸ برابر سریع‌تر از مدل‌های مشابه ایجاد کند. مدل‌های زبانی بزرگ مانند ChatGPT […]

مهر ۲۲, ۱۴۰۴ | 2 دقیقه خواندن
چاپ خبر

مدل زبانی جدید اپل با بهره‌گیری از معماری پیشرفته قادر است متن‌های بلند و پیچیده را با سرعتی فوق‌العاده و دقت بالا تولید کند. براساس گزارش‌ها، تیم تحقیقاتی اپل یک مدل مبتنی بر Diffusion ارائه کرده است که می‌تواند متن‌ها را تا ۱۲۸ برابر سریع‌تر از مدل‌های مشابه ایجاد کند.

مدل‌های زبانی بزرگ مانند ChatGPT از نوع Autoregressive هستند؛ این مدل‌ها متن را به‌صورت توکن به توکن و پشت سر هم تولید می‌کنند و هر توکن را با در نظر گرفتن ورودی کاربر و تمام توکن‌های پیشین می‌سازند.

مدل زبانی جدید اپل سرعت بسیار زیادی دارد

در مقابل، مدل‌های Diffusion چند توکن را همزمان تولید کرده و در چند مرحله اصلاح می‌کنند تا پاسخ نهایی شکل بگیرد. یکی از انواع پیشرفته این مدل‌ها، Flow-matching است که مراحل اصلاح چندگانه را کنار می‌گذارد و تلاش می‌کند نتیجه نهایی را در یک مرحله به‌دست آورد.

معرفی مدل زبان سریع اپل

مطالعه جدید اپل با عنوان «FS-DFM: Fast and Accurate Long Text Generation with Few-Step Diffusion Language Models» یک مدل جدید موسوم به Few-Step Discrete Flow-Matching (FS-DFM) معرفی می‌کند. این مدل می‌تواند متن‌های بلند را تنها با هشت مرحله اصلاح با سرعتی زیادی تولید کند، درحالی‌که مدل‌های Diffusion معمولی بیش از هزار مرحله نیاز داشتند تا کیفیت مشابه ارائه دهند.

برای رسیدن به این سرعت، پژوهشگران از سه مرحله استفاده کرده‌اند: ابتدا مدل آموزش می‌بیند که چندین مرحله اصلاح متن را مدیریت کند، سپس یک مدل «معلم» برای انجام به‌روزرسانی‌های دقیق و بزرگ‌تر در هر مرحله به کار گرفته می‌شود و در نهایت نحوه اجرای هر مرحله بهینه می‌شود تا مدل بتواند با طی مراحل کمتر و ثبات بیشتر به نتیجه برسد.

معرفی مدل زبان سریع اپل

در مقایسه با مدل‌های بزرگ مشابه، FS-DFM در معیارهای «آنتروپی» و «سردرگمی» عملکرد قابل توجهی داشته است. سردرگمی کیفیت متن را اندازه می‌گیرد؛ هرچه پایین‌تر باشد، متن طبیعی‌تر و دقیق‌تر است. آنتروپی میزان اطمینان مدل در انتخاب هر کلمه را نشان می‌دهد؛ مقدار پایین متن را تکراری یا قابل پیش‌بینی می‌کند و مقدار زیاد باعث می‌شود متن نامنسجم یا تصادفی شود.

مدل FS-DFM با پارامترهای ۱.۷، ۱.۳ و ۰.۱۷ میلیارد، در مقایسه با مدل‌های Dream و LLaDA با ۷ و ۸ میلیارد پارامتر، در معیار سردرگمی عددی پایین‌تر و در آنتروپی نتیجه‌ای پایدارتر به‌دست آورد.

باتوجه‌به عملکرد عالی و کمبود مدل‌های مشابه، پژوهشگران اعلام کرده‌اند که قصد دارند کد و چک‌پوینت‌های مدل را منتشر کنند تا امکان بازتولید و تحقیقات بیشتر فراهم شود. مطالعه کامل مقاله در arXiv شامل نمونه‌های عملکردی و نمودارهایی است که مراحل اصلاح هر توکن و نحوه تغییرات آن را نشان می‌دهد.

هیچ دیدگاهی درج نشده - اولین نفر باشید

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

هشتگ

اجتماعی
اخبار
اقتصادی
اینفوگرافی
بین الملل
پیشنهاد سردبیر
تحریریه
تیتر یک
چندرسانه‌ای
حوادث
سیاسی
شهر
شهروند خبرنگار
عکس
فرهنگی و هنری
فناوری و IT
فیلم
گزارش
موشن گرافی
ورزشی
وعده ها
یادداشت

آخرین اخبار

  • حادثه خودسوزی جوان اهوازی باید ریشه‌ای بررسی شود / برخی ادارات و شهرداریها با مردم چماقی برخورد می‌کنند
  • غیبت معنا دار همزمان گرجستان و جمهوری آذربایجان در نشست مجمع پارلمانی شورای اروپا
  • گوشی‌های پیکسل به قابلیت خلاصه‌سازی اعلان‌ها مجهز می‌شوند
  • اختتامیه نهمین جشنواره فیلم شهر در برج میلاد برگزار می‌شود
  • پزشکیان: همه دستگاه‌ها در زمینه رفع ناترازی‌ها اقدام کنند
  • روایت مسکو از تماس‌ تلفنی لاوروف و عراقچی
  • چالش‌های دسترسی بیماران دیابتی به انسولین/ پای لنگ بیمه‌ها در آموزش به دیابتی‌ها
  • ابر مستعد بیاید بارورسازی می‌کنیم/ افزایش ذخیره سوخت مایع نیروگاه‌ها به ۳میلیارد لیتر

فناوری اطلاعات

گوشی‌های پیکسل به قابلیت خلاصه‌سازی اعلان‌ها مجهز می‌شوند

سونی تاکنون بیش از ۸۴ میلیون دستگاه کنسول PS5 فروخته است

آیا می‌توان هیولای فرانکنشتاین را در دنیای واقعی ساخت؟ علم پاسخ می‌دهد

از مک‌بوک اقتصادی اپل با تراشه آیفون چه انتظاراتی داریم؟

استفاده از موبایل قبل از خواب شاید مسبب کاهش کیفیت خواب نباشد

  • ارتباط با ما
  • درباره ما
  • خرید جدیدترین نشریات
logo-samandehi
ایتا
بله
روبیکا
تلگرام
اینستاگرام

نقل و نشر مطالب با ذکر منبع بلامانع است.

تهیه و تولید :تابناک وب