• تماس با ما
  • درباره ما
دوشنبه, خرداد 26, 1404
  • ورود کاربر
  • خانه
  • اخبار
    • اجتماعی
    • سیاسی
    • اقتصادی
    • بین الملل
    • فناوری
    • ورزشی
    • فرهنگی و هنری
  • کاروکسب
  • باریخ
    • اجتماعی
    • فناوری
    • اقتصاد
    • زیست بوم
    • سیاست
    • ارزش و فرهنگ
    • رسانه
    • نیروی انسانی و نظامی
    • امنیت
    • حقوق
  • تاریخ
    • تاریخ نگری
    • تاریخ نگاری
    • خاطره نگاری
  • پرسمان
  • پندار
  • پادپخش
  • پادرخ
بدون نتیجه
نمایش همه نتایج
  • خانه
  • اخبار
    • اجتماعی
    • سیاسی
    • اقتصادی
    • بین الملل
    • فناوری
    • ورزشی
    • فرهنگی و هنری
  • کاروکسب
  • باریخ
    • اجتماعی
    • فناوری
    • اقتصاد
    • زیست بوم
    • سیاست
    • ارزش و فرهنگ
    • رسانه
    • نیروی انسانی و نظامی
    • امنیت
    • حقوق
  • تاریخ
    • تاریخ نگری
    • تاریخ نگاری
    • خاطره نگاری
  • پرسمان
  • پندار
  • پادپخش
  • پادرخ
بدون نتیجه
نمایش همه نتایج
باریخ نیوز
بدون نتیجه
نمایش همه نتایج
خانه اخبار فناوری

داده‌های جهان برای تغذیه هوش مصنوعی در حال اتمام است

کارشناسان هشدار می‌دهند که داده‌های جهان برای تغذیه هوش مصنوعی در حال اتمام است.

22 آبان, 1402
در فناوری

باریخ نیوز : در حالی که هوش مصنوعی این روزها به اوج محبوبیت خود می‌رسد، پژوهشگران هشدار داده‌اند که این صنعت ممکن است با کمبود داده‌های آموزشی روبرو شود.

داده‌ها به مانند سوختی هستند که سیستم‌های هوش مصنوعی قدرتمند را نیرو می‌دهند و این مشکل می‌تواند رشد مدل‌های هوش مصنوعی، به ویژه مدل‌های زبانی بزرگ را کاهش دهد و حتی ممکن است مسیر انقلاب هوش مصنوعی را تغییر دهد.

اما چرا کمبود بالقوه داده با توجه به میزان موجود در شبکه جهانی وب یک مشکل است و اینکه آیا راهی برای مقابله با این خطر وجود دارد؟

اهمیت داده‌های با کیفیت بالا برای هوش مصنوعی

ما برای آموزش الگوریتم‌های هوش مصنوعی قدرتمند، دقیق و با کیفیت به داده‌های زیادی نیاز داریم. به عنوان مثال، چت‌بات ChatGPT بر روی ۵۷۰ گیگابایت داده متنی یا حدود ۳۰۰ میلیارد کلمه آموزش داده شده است.

به طور مشابه، الگوریتم انتشار پایدار(که پشت بسیاری از برنامه‌های تولید تصویر هوش مصنوعی مانند DALL-E، Lensa و Midjourney قرار دارد) بر روی مجموعه داده LIAON-۵B متشکل از ۵.۸ میلیارد جفت تصویر-متن آموزش داده شده است. اگر الگوریتمی روی مقدار ناکافی داده آموزش داده شود، خروجی‌های نادرست یا با کیفیت پایین تولید می‌کند.

کیفیت داده‌های آموزشی نیز مهم است. دسترسی به داده‌های با کیفیت پایین مانند پست‌های رسانه‌های اجتماعی یا عکس‌های تار آسان است، اما برای آموزش مدل‌های هوش مصنوعی با کارایی بالا کافی نیستند.

متنی که از سکوهای رسانه‌های اجتماعی گرفته می‌شود ممکن است مغرضانه یا تعصب‌آمیز باشد یا ممکن است حاوی اطلاعات نادرست یا محتوای غیرقانونی باشد که می‌تواند توسط مدل هوش مصنوعی تکرار شود. به عنوان مثال، زمانی که مایکروسافت سعی کرد ربات هوش مصنوعی خود را با استفاده از محتوای توییتر آموزش دهد، دریافت که خروجی‌های نژادپرستانه و زن‌ستیز تولید می‌کند.

به همین دلیل است که توسعه‌دهندگان هوش مصنوعی به دنبال محتوای باکیفیت مانند متن از کتاب‌ها، مقالات آنلاین، مقالات علمی، ویکی‌پدیا و محتوای وب فیلتر شده خاص هستند. مثلا Google Assistant بر روی ۱۱ هزار رمان عاشقانه برگرفته از سایت خودانتشار Smashwords آموزش دیده است تا اطلاعات بیشتری در چنته داشته باشد.

آیا ما داده‌های کافی داریم؟

صنعت هوش مصنوعی، سیستم‌های هوش مصنوعی را بر روی مجموعه داده‌های بزرگ‌تر آموزش می‌دهد، به همین دلیل است که ما اکنون مدل‌هایی با عملکرد بالا مانند ChatGPT یا DALL-E ۳ داریم. در عین حال، تحقیقات نشان می‌دهد که ذخیره داده‌های آنلاین بسیار کندتر از مجموعه داده‌های مورد استفاده در حال رشد برای آموزش هوش مصنوعی هستند.

در مقاله‌ای که سال گذشته منتشر شد، گروهی از پژوهشگران پیش‌بینی کردند که اگر روند آموزشی فعلی هوش مصنوعی ادامه یابد، قبل از سال ۲۰۲۶ داده‌های متنی با کیفیت بالا تمام خواهد شد.

آنها همچنین تخمین زدند که داده‌های زبانی با کیفیت پایین بین سال‌های ۲۰۳۰ تا ۲۰۵۰ و داده‌های تصویری با کیفیت پایین بین سال‌های ۲۰۳۰ تا ۲۰۶۰ به پایان می‌رسد.

به گفته گروه مشاوره و حسابداری PwC، هوش مصنوعی تا سال ۲۰۳۰ می‌تواند تا ۱۵.۷ تریلیون دلار به اقتصاد جهان کمک کند. اما تمام شدن داده‌های قابل استفاده می‌تواند توسعه آن را آهسته کند.

آیا باید نگران باشیم؟

در حالی که نکات بالا ممکن است برخی از طرفداران هوش مصنوعی را نگران کند، این وضعیت ممکن است آنقدرها هم که به نظر می‌رسد بد نباشد. ناشناخته‌های زیادی در مورد چگونگی توسعه مدل‌های هوش مصنوعی در آینده و همچنین چند راه برای مقابله با خطر کمبود داده وجود دارد.

یکی از فرصت‌ها برای توسعه‌دهندگان هوش مصنوعی است که الگوریتم‌ها را بهبود ببخشند تا از داده‌هایی که در حال حاضر در اختیار دارند به طور کارآمدتر استفاده کنند.

این احتمال وجود دارد که در سال‌های آینده آنها بتوانند سیستم‌های هوش مصنوعی با عملکرد بالا را با استفاده از داده‌های کمتر و احتمالاً قدرت محاسباتی کمتر آموزش دهند. این همچنین به کاهش ردپای کربن هوش مصنوعی کمک می‌کند.

گزینه دیگر استفاده از هوش مصنوعی برای ایجاد داده‌های مصنوعی برای آموزش سیستم‌هاست. به عبارت دیگر، توسعه‌دهندگان به سادگی می‌توانند داده‌های مورد نیاز خود را تولید کنند که متناسب با مدل هوش مصنوعی خاص آنها باشد.

چندین پروژه در حال حاضر از محتوای مصنوعی استفاده می‌کنند که اغلب از سرویس‌های تولید داده مانند Mostly AI تهیه می‌شود. این امر در آینده رایج‌تر خواهد شد.

توسعه دهندگان همچنین به دنبال محتوایی خارج از فضای آنلاین رایگان هستند، مانند محتوایی که توسط ناشران بزرگ و مخازن آفلاین نگهداری می‌شود. به میلیون‌ها متن منتشر شده قبل از دوران فراگیری اینترنت فکر کنید. آنهایی که به صورت دیجیتالی درنیامده‌اند و در دسترس قرار بگیرند، می‌توانند منبع جدیدی از داده‌ها را برای پروژه‌های هوش مصنوعی فراهم کنند.

بنیاد News Corp یکی از بزرگترین دارندگان محتوای خبری در جهان اخیراً اعلام کرده است که در حال مذاکره با توسعه‌دهندگان هوش مصنوعی برای قراردادهای محتواست. چنین معاملاتی شرکت‌های هوش مصنوعی را مجبور می‌کند برای داده‌های آموزشی پول بپردازند، در حالی که تاکنون بیشتر آنها را به صورت رایگان از اینترنت حذف کرده‌اند.

سازندگان محتوا نسبت به استفاده غیرمجاز از محتوای خود برای آموزش مدل‌های هوش مصنوعی اعتراض کرده‌اند و برخی از شرکت‌هایی مانند مایکروسافت، OpenAI و Stability AI شکایت کرده‌اند. دریافت پاداش برای کار آنها ممکن است به بازگرداندن برخی از عدم تعادل قدرت بین خلاقان و شرکت‌های هوش مصنوعی کمک کند.

منبع : ایسنا

پست قبلی

چینی‌ها یک ماده معجزه‌آسا خلق کردند!

پست بعدی

تلاش آمریکا برای فروش هرچه بیشتر خودروهای الکتریکی

پست بعدی
تلاش آمریکا برای فروش هرچه بیشتر خودروهای الکتریکی

تلاش آمریکا برای فروش هرچه بیشتر خودروهای الکتریکی

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

بدون نتیجه
نمایش همه نتایج

نوشته‌های تازه

  • آسیب شناسی سیاست خارجی جمهوری اسلامی
    علی عیدی پور
  • تحلیل سفر ترامپ به خاورمیانه بر اساس آیین قدرت و نظریه هارتلند-ریملند بزرگ
    مهدی مطهرنیا
  • برگزاری کارگاه «روش‌های کمی در آینده‌پژوهی» با حضور دکتر مهدی مطهرنیا/ عکس
  • دبیر شورای عالی امنیت ملی:
    در موضوع مذاکره با آمریکا آنچه تغییر کرد شرایط بود نه موضع نظام
  • اسحاق جهانگیری:
    شوخی با روح جمعی ایرانیان زخمی بر پیکر صلح جهانی وارد می‌کند
آسیب شناسی سیاست خارجی جمهوری اسلامیعلی عیدی پور

آسیب شناسی سیاست خارجی جمهوری اسلامی
علی عیدی پور

آیا چین ماشه را خواهد کشید؟ مهدی مطهرنیا

تحلیل سفر ترامپ به خاورمیانه بر اساس آیین قدرت و نظریه هارتلند-ریملند بزرگ
مهدی مطهرنیا

سه گانه های جنگ های سایه وارجنگ مینیاتوری

سه گانه های جنگ های سایه وار
جنگ مینیاتوری

فناوری‌های کوانتومی؛ معرفی، کاربردها و چالش‌ها – بخش اول حسین داودی یگانه

فناوری‌های کوانتومی؛ معرفی، کاربردها و چالش‌ها – بخش اول
حسین داودی یگانه

گفت و گوی دکتر مهدی مطهرنیا با باریخ نیوز درباره برگزاری دوره های آموزشی:    NBA؛ DBAو POST DBAدوره‌های مهارتی مدیریت آینده هستند سازمان‌ها، افراد و نهادها می توانند برحسب نیاز از دوره‌های مهارتی  استفاده کنند

سناریوهای پیشاروی جنگ غزه با توجه به نقش تهران

توسعه درک عمیق از فن آوری های دیجیتال

توسعه درک عمیق از فن آوری های دیجیتال

بیشتر بخوانید

دسته‌ها

  • اجتماعی
  • اخبار
  • اقتصادی
  • اندیشه ورزی
  • باریخ
  • باریخ_سیاست
  • باریخ-ارزش و فرهنگ
  • باریخ-اقتصاد
  • باریخ-حقوق
  • باریخ-زیست بوم
  • باریخ-فناوری
  • برگزیده
  • بین الملل
  • پادپخش
  • پادرخ
  • پندار
  • تاریخ
  • دسته‌بندی نشده
  • سیاسی
  • فرهنگی و هنری
  • فناوری
  • فناوری‌های نوظهور دیجیتال
  • کار و کسب
  • گزارش
  • گفتگو
  • مقاله
  • میزگرد
  • نیروی انسانی و نظامی
  • ورزش
  • ویژه
  • یادداشت

آسیب شناسی سیاست خارجی جمهوری اسلامی
علی عیدی پور

31 اردیبهشت, 1404

تحلیل سفر ترامپ به خاورمیانه بر اساس آیین قدرت و نظریه هارتلند-ریملند بزرگ
مهدی مطهرنیا

28 اردیبهشت, 1404

برگزاری کارگاه «روش‌های کمی در آینده‌پژوهی» با حضور دکتر مهدی مطهرنیا/ عکس

20 اردیبهشت, 1404

دبیر شورای عالی امنیت ملی:
در موضوع مذاکره با آمریکا آنچه تغییر کرد شرایط بود نه موضع نظام

18 اردیبهشت, 1404

اسحاق جهانگیری:
شوخی با روح جمعی ایرانیان زخمی بر پیکر صلح جهانی وارد می‌کند

18 اردیبهشت, 1404
  • تماس با ما
  • درباره ما
فهرست
  • تماس با ما
  • درباره ما
Facebook Twitter Youtube
بدون نتیجه
نمایش همه نتایج
  • خانه
  • اخبار
    • اجتماعی
    • سیاسی
    • اقتصادی
    • بین الملل
    • فناوری
    • ورزشی
    • فرهنگی و هنری
  • کاروکسب
  • باریخ
    • اجتماعی
    • فناوری
    • اقتصاد
    • زیست بوم
    • سیاست
    • ارزش و فرهنگ
    • رسانه
    • نیروی انسانی و نظامی
    • امنیت
    • حقوق
  • تاریخ
    • تاریخ نگری
    • تاریخ نگاری
    • خاطره نگاری
  • پرسمان
  • پندار
  • پادپخش
  • پادرخ

خوش آمدید!

به حساب خود وارد شوید

فراموشی رمز عبور ؟

رمز عبور خود را بازیابی کنید

لطفاً ایمیل یا نام کاربری خود را جهت بازیابی رمز عبور وارد نمایید

وارد شدن