• درباره ما
  • تماس باما
بدون نتیجه
مشاهده تمام نتایج
یکشنبه ۲۷, اردیبهشت ۱۴۰۵
نبض ارز
  • صفحه اصلی
  • آموزش
    • آموزش تحلیل تکنیکال
    • آموزش تحلیل فاندامنتال
    • آموزش کیف پول ها
    • آموزش بلاکچین
  • خبر
    • اخبار بیت کوین
    • اخبار آلت کوین ها
    • اخبار ایردراپ ها
    • اخبار عمومی بازار
  • مقالات
    • مقالات بیت کوین
    • مقالات ایردراپ
    • مقالات بلاکچین
    • مقالات آلت کوین ها
    • مقالات تحلیلی
    • مقالات قانون‌گذاری
  • هوش مصنوعی
  • کلاهبرداری ها
  • مدیریت سرمایه و روانشناسی
  • ویکی نبض ارز
نقشه بازار
برای بیت کوینرها
نبض ارز
  • صفحه اصلی
  • آموزش
    • آموزش تحلیل تکنیکال
    • آموزش تحلیل فاندامنتال
    • آموزش کیف پول ها
    • آموزش بلاکچین
  • خبر
    • اخبار بیت کوین
    • اخبار آلت کوین ها
    • اخبار ایردراپ ها
    • اخبار عمومی بازار
  • مقالات
    • مقالات بیت کوین
    • مقالات ایردراپ
    • مقالات بلاکچین
    • مقالات آلت کوین ها
    • مقالات تحلیلی
    • مقالات قانون‌گذاری
  • هوش مصنوعی
  • کلاهبرداری ها
  • مدیریت سرمایه و روانشناسی
  • ویکی نبض ارز
بدون نتیجه
مشاهده تمام نتایج
بدون نتیجه
مشاهده تمام نتایج
نبض ارز
بدون نتیجه
مشاهده تمام نتایج
صفحه اصلی هوش مصنوعی

تلاش ناموفق هوش مصنوعی در بازسازی متون تاریخی

سعید دبیری فر توسط سعید دبیری فر
۱۴ اردیبهشت ۱۴۰۴
در هوش مصنوعی
مدت زمان مطالعه: 5 دقیقه
0
تلاش موفق هوش مصنوعی در بازسازی متون تاریخی
1k
بازدیدها
اشتراک گذاری در توییتراشتراک گذاری در تلگرام
✦ خلاصه مطلب : جدید

پژوهشگران دانشگاه‌های ایلی‌نویس، بریتیش کلمبیا و کورنل در مقاله‌ای به بررسی توانایی مدل‌های زبانی بزرگ در بازتولید لحن و اصطلاحات متون تاریخی اوایل قرن بیستم پرداخته‌اند. انگیزه این پژوهش به نیازهای دانشگاه‌ها و علاقه صنعت سرگرمی به بازسازی آثار کلاسیک مرتبط می‌شود.

روش پژوهش شامل سه مرحله است: نخست، استفاده از پرامپت‌نویسی برای تولید متون تاریخی توسط مدل‌های مختلف؛ دوم، ارزیابی عملکرد مدل‌های GPT-1914 و GPT-4o در تقلید سبک دوره‌ای؛ و سوم، سنجش آماری کیفیت خروجی‌ها و مقایسه آنها از نظر تناسب زمانی و دقت محتوا.

نتایج نشان می‌دهد که ریزتنظیم فقط قادر به شبیه‌سازی سطحی سبک نوشتاری است و چالش‌های متعددی در بازتولید متن تاریخی وجود دارد. پژوهشگران پیشنهادهایی برای بهبود شامل همکاری با آرشیوهای تاریخی و توسعه مدل‌های کم‌هزینه‌تر ارائه می‌دهند و تأکید می‌کنند که پیشرفت در این زمینه نیازمند همکاری میان رشته‌ها با رویکردی هم‌افزایانه است.

محتوای خلاصه‌سازی شده توسط هوش مصنوعی نبض ارز

پژوهشگران دانشگاه ایلی‌نویس، بریتیش کلمبیا و کورنل در مقاله‌ای با عنوان “آیا هوش مصنوعی های مدل‌های زبانی می‌توانند گذشته را بدون آناکرونیسم بازنمایی کنند؟“ به این پرسش بنیادین پرداخته‌اند که آیا مدل‌های زبانی بزرگ مثل ChatGPT-4o می‌توانند لحن و اصطلاحات متون آغاز قرن بیستم را به‌درستی بازتولید کنند یا نه. انگیزه اصلی این کار از چند ناحیه نشأت می‌گیرد: گسترش پروژه‌های خودکار تکمیل آثار تاریخی ناتمام، علاقه صنعت سرگرمی به بازسازی رمان‌های کلاسیک مانند آخرین اثر چارلز دیکنز و نیاز ایده‌آل دانشگاه‌ها و موزه‌ها به تولید متون تاریخی باورپذیر. اما سؤال این است که بدون دسترسی به مجموعه داده‌های عظیم تاریخی، چگونه می‌توان این خواسته را عملی کرد؟

وقتی از مدل خواسته می‌شود یک متن تاریخی واقعی را کامل کند (بالای وسط)، حتی یک ChatGPT-4o که با پرامپت‌های مناسب به‌خوبی آماده شده (پایین سمت چپ) نیز نمی‌تواند از حالت «بلاگی» فاصله بگیرد و در انتقال اصطلاح درخواستی شکست می‌خورد. در مقابل، مدل GPT-2 ریزتنظیم‌شده (پایین سمت راست) سبک زبان را به‌خوبی بازتولید می‌کند، اما در سایر جنبه‌ها دقت لازم را ندارد.منبع: [https://arxiv.org/pdf/2505.00030](https://arxiv.org/pdf/2505.00030)
وقتی از مدل خواسته می‌شود یک متن تاریخی واقعی را کامل کند (بالا وسط)، حتی ChatGPT-4o که با پرامپت‌های مناسب به‌خوبی آماده شده (پایین سمت چپ) نیز نمی‌تواند از حالت «بلاگی» فاصله بگیرد و در انتقال اصطلاح درخواستی شکست می‌خورد. در مقابل، مدل GPT-2 فاین‌تیون شده (پایین سمت راست) سبک زبان را به‌خوبی بازتولید می‌کند، اما در سایر جنبه‌ها دقت لازم را ندارد.
منبع: https://arxiv.org/pdf/2505.00030

آنچه خواهید خواند:

Toggle
  • روش پژوهش
  • نتایج مرحله نخست: صفحه بلاگ به جای نثر تاریخی
  • عملکرد مدل دوره‌ای (GPT-1914)
  • سنجش آماری با طبقه‌بند تاریخ‌یاب
  • فاین‌تیون (Fine-Tuning) و نتایج آن
  • ارزیابی انسانی و چالش قضاوت
  • چالش‌ها و چشم‌انداز آینده

روش پژوهش

پژوهش در سه فاز صورت گرفت. در گام نخست، رویکرد پرامپت‌نویسی به کار رفت: قطعه‌هایی از متون منتشرشده بین ۱۹۰۵ تا ۱۹۱۴ به ChatGPT-4o داده شد و از آن خواسته شد ادامه‌ای ۲۰۰ کلمه‌ای به همان سبک تولید کند. سپس همین آزمون روی مدلی کوچک‌تر به نام GPT-1914 انجام گرفت؛ مدلی که از ابتدا تنها روی ادبیات ۱۸۸۰–۱۹۱۴ آموزش دیده بود. سرانجام، در فاز سوم، نسخه‌ای از GPT-4o-mini از طریق فاین‌تیون (fine-tuning) روی حدود دو هزار جفت «متن واقعی–ادامه متن» آموزش داده شد تا ببینند این قدر تغییر وزن‌ها می‌تواند به تولید متون تاریخی کمک کند یا خیر.


نتایج مرحله نخست: صفحه بلاگ به جای نثر تاریخی

خروجی ChatGPT-4o، علی‌رغم فیوشات و سینگل‌شات پرامپتینگ، بیشتر شبیه مطالب ویکی یا بلاگ معاصر بود: جملات کوتاه، واژه‌های امروزی مانند «رزولوشن» و «نویز» و تمرکز بر مباحث کلی تصویرسازی. این مدل حتی با ارائه دستورالعمل دقیق («فقط ادامه متن را ارائه کن، عنوان یا توضیح اضافه نده») نیز بارها از چارچوب تاریخی فاصله گرفت و ضمناً انسجام موضوعی ضعیفی داشت؛ به جای پیگیری بحث اصلی درباره نور سرد در عکاسی، وارد مبحث جدیدی می‌شد.


عملکرد مدل دوره‌ای (GPT-1914)

مدل GPT-1914، گرچه انسجامی به‌پای ChatGPT-4o نداشت، در تقلید سبک نگارش دوره بسیار موفق بود. طول جملات مشابه رساله‌های فنی آن روزگار بود و از ارجاعات درون‌متنی بهره می‌برد (مثلاً اشاره به صفحه و پاراگراف‌های قبلی). اما این دقت ساختاری به قیمت فروکش کردن در کیفیت نگارش فنی و صحت جزئیات فنی (مانند دمای عکاسی سریع) تمام شد. به‌عبارت دیگر، آنچه از نظر «لحن تاریخی» ارزشمند بود، گاه از نظر «دقت محتوا» نقصان داشت.


سنجش آماری با طبقه‌بند تاریخ‌یاب

برای سنجش آماری تطابق سبک، گروه پژوهشی مدل RoBERTa را با داده‌هایی از سال‌های ۱۸۱۰ تا ۲۰۰۹ آموزش دادند تا بتواند تاریخ تقریبی انتشار متن را پیش‌بینی کند. سپس با محاسبه Jensen–Shannon divergence بین توزیع تخمین‌های مدل و توزیع واقعی متون دوره، دریافتند مدل GPT-1914 تنها ۰٫۰۰۶ از نمونه واقعی فاصله دارد. در مقابل، خروجی‌های ChatGPT-4o پس از یک‌شات prompting اختلاف به ترتیب ۰٫۳۱۰ و ۰٫۳۵۰ نشان دادند که نمایانگر تمایل واضح به سبک قرن بیست‌ویکم است.


فاین‌تیون (Fine-Tuning) و نتایج آن

با آموزش GPT-4o-mini روی مجموعه‌ کوچکی از جفت «متن تاریخی – ادامه واقعی»، این مدل تا حد زیادی توانست ویژگی‌های ظاهری زبان را بهبود دهد. divergence آن به ۰٫۰۰۲ رسید، رقمی که با GPT-1914 قابل مقایسه است.

اما پژوهشگران هشدار دادند این شاخص تنها معیارهای سطحی مانند انتخاب واژگان و ساختار جملات را می‌سنجد و نمی‌تواند عمق آناکرونیسم‌های مفهومی یا فرهنگی را چک کند. به عبارت دیگر، ممکن است متنی ظاهراً «در دوره ضبط‌شده» باشد اما بازتاب‌دهنده باورها، پیش‌فرض‌ها یا حقایق نادرست آن زمان باشد.


ارزیابی انسانی و چالش قضاوت

سه کارشناس ادبیات تاریخی ۱۲۰ ادامه متن تولیدشده را از نظر «باورپذیری برای نویسنده‌ای در ۱۹۱۴» بررسی کردند. اگرچه توافق کلیشان حدود ۸۰٪ بود، Cohen’s κ برابر ۰٫۵۵۴ ثبت شد که نشان می‌دهد قضاوت درباره مرز میان سبک تاریخی و نفوذ دیدگاه امروزی دشوار است.

داوران برای تازه‌ترین مفاهیم پزشکی (بری-بری) یا موقعیت‌های جغرافیایی (آلزاس) نیازمند ارجاع به منابع بودند. در آزمون «متن نفوذی» که در آن پاسخ اصلی میان سه پاسخ تولیدشده پنهان می‌شد، حتی بهترین مدل (فاین‌تیون شده GPT-4o-mini) نتوانست از شناسایی متون واقعی توسط داوران در بیش از نیمی از موارد جلوگیری کند.


چالش‌ها و چشم‌انداز آینده

این پژوهش نشان داد پرامپت‌نویسی ساده برای تولید متن تاریخی کافی نیست و ریزتنظیم تنها سبک سطحی را شبیه‌سازی می‌کند. پیش‌آموزش کامل روی میلیاردها توکن تاریخی اگرچه نتایج بهتری می‌دهد، اما منابع محاسباتی و داده‌ای لازم برایش بسیار زیاد است. برای گسترش این حوزه، پیشنهاد می‌شود:

  1. ترکیب نمادگرایی و آماری: القای قواعد دستوری و واژگانی خاص دوره در کنار مدل‌های توزیعی؛
  2. بازخورد مداوم انسانی: ایجاد چرخه human-in-the-loop تا مدل بتواند از تصحیحات مستقیم محققان بهره ببرد؛
  3. معیارهای عمیق‌تر سنجش آناکرونیسم: استفاده از طبقه‌بندهای شناختی-فرهنگی برای تشخیص تناقض‌های مفهومی؛
  4. ایجاد و به‌اشتراک‌گذاری مجموعه‌داده‌های غنی‌تر: همکاری با کتابخانه‌ها و آرشیوهای تاریخی برای دیجیتال‌سازی نامه‌ها، روزنامه‌ها و خاطرات؛
  5. به‌کارگیری معماری‌های سبک‌تر: پژوهش روی مدل‌های کم‌هزینه‌تر که پذیرای ریزتنظیم‌های دوره‌ای شوند.

در نهایت، هر تلاش برای بازآفرینی صدا و ذهنیت دوره‌های گذشته مستلزم انتخاب میان «وفاداری تاریخی» و «روان‌خوانی» است. پیشرفت در این حوزه نیازمند تعامل نزدیک بین علم داده، زبان‌شناسی تاریخی و کارشناسان حوزه‌های مرتبط خواهد بود.

پست قبلی

نگاهی جامع به معیارها و پیش‌شرط‌های آغاز آلت‌سیزن و بررسی آنها

پست‌ بعدی

تحول سهام شرکت لجیستیکی با میم‌کوین ترامپ

سعید دبیری فر

سعید دبیری فر

سعیدم، فعال و عاشق رمرارزها و هوش مصنوعی!

پست های مرتبط

مشاوره سئو سایت ارزدیجیتال با سید احسان خسروی

مشاوره سئو سایت ارزدیجیتال با سید احسان خسروی

توسط کارشناس روابط عمومی
۱۹ مهر ۱۴۰۴
0
1.4k

حوزه‌ی ارزهای دیجیتال در دسته‌ی YMYL (همان Your Money or Your Life) قرار دارد؛ یعنی محتوای آن مستقیماً بر تصمیم‌های...

هوش مصنوعی، غولی آینده‌نگر با چشمانی نابینا به گذشته

هوش مصنوعی، غولی آینده‌نگر با چشمانی نابینا به گذشته

توسط سعید دبیری فر
۳۰ مرداد ۱۴۰۴
0
1.1k

در عصر هوش مصنوعی که الگوریتم‌ها قادر به خلق هنر، نوشتن کد و تحلیل بازارهای مالی هستند، یک تصور عمومی...

پارادوکس انرژی هوش مصنوعی؛ مصرف‌کننده‌ی بزرگ یا ناجی اکوسیستم؟

پارادوکس انرژی هوش مصنوعی؛ مصرف‌کننده‌ی بزرگ یا ناجی اکوسیستم؟

توسط سعید دبیری فر
۲۶ مرداد ۱۴۰۴
0
1k

غول‌های فناوری جهان با تمام قوا به سمت انرژی هجوم برده‌اند. مراکز داده‌ای که برای کاربردهای هوش مصنوعی ساخته می‌شوند،...

رمزگشایی از شخصیت هوش مصنوعی: کشف «بردارهای شخصیت» چگونه آینده AI را تغییر می‌دهد؟

رمزگشایی از شخصیت هوش مصنوعی: کشف «بردارهای شخصیت» چگونه آینده AI را تغییر می‌دهد؟

توسط سعید دبیری فر
۲۵ مرداد ۱۴۰۴
0
1k

دانشمندان به تازگی به یک پیشرفت شگرف در درک و کنترل شخصیت ماشین دست یافته‌اند که می‌تواند آینده تعامل ما...

GPT-5 عرضه شد: همه‌چیز درباره غول جدید OpenAI که دنیا را متحول می‌کند

GPT-5 عرضه شد: همه‌چیز درباره غول جدید OpenAI که دنیا را متحول می‌کند

توسط سعید دبیری فر
۱۶ مرداد ۱۴۰۴
0
1.1k

سرانجام پس از ماه‌ها انتظار و گمانه‌زنی، شرکت OpenAI به طور رسمی از GPT-5، جدیدترین و انقلابی‌ترین مدل هوش مصنوعی...

سراب هوش مصنوعی چین: وقتی «متن‌باز» بودن، مهم‌ترین چیزها را پنهان می‌کند

سراب هوش مصنوعی چین: وقتی «متن‌باز» بودن، مهم‌ترین چیزها را پنهان می‌کند

توسط سعید دبیری فر
۱۳ مرداد ۱۴۰۴
0
1k

در میانه رقابت تنگاتنگ غول‌های فناوری مانند گوگل، مایکروسافت و متا برای سلطه بر بازار هوش مصنوعی، بازیگران بزرگ چینی...

پست‌ بعدی
تحول سهام شرکت لجیستیکی با میم‌کوین ترامپ

تحول سهام شرکت لجیستیکی با میم‌کوین ترامپ

دیدگاهتان را بنویسید لغو پاسخ

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

مقالات خواندنی

مقالات

دو محصول پر طرفدار برای افزایش وزن و انرژی

توسط کارشناس روابط عمومی
۱۹ شهریور ۱۴۰۴
2
4.9k

عزیزان امروز میخوام در مورد دو محصول پر طرفدار که مشتریان زیادی دارند رو معرفی کنیم. این دو محصول بسیار...

ادامه مطلب

معرفی 10 تریدر برتر ایران در سال 2025

۰۱ مهر ۱۴۰۴
4.2k
تأثیر جنگ منطقه‌ای رژیم صهیونیستی و حزب‌الله بر قیمت طلا

تأثیر جنگ منطقه‌ای رژیم صهیونیستی و حزب‌الله بر قیمت طلا

۰۷ مهر ۱۴۰۳
1.9k
هَمستر کامبت 5 مهر لیست می‌شود؛ در ادامه چطور بازی کنیم؟

هَمستر کامبت 5 مهر لیست می‌شود؛ در ادامه چطور بازی کنیم؟

۲۰ شهریور ۱۴۰۳
1.6k
بیت‌کوین

تاریخچه بیت‌کوین در ایران

۱۸ دی ۱۴۰۳
1.6k

آخرین اخبار

ارزش معامله جدید بنیاد اتریوم به ۲۲.۹ میلیون دلار رسید
اخبار عمومی بازار

ارزش معامله جدید بنیاد اتریوم به ۲۲.۹ میلیون دلار رسید

توسط مسیحا حیدریان
۱۲ اردیبهشت ۱۴۰۵
0
1k

به گزارش نبض ارز، بنیاد اتریوم سومین معامله خارج از صرافی (OTC) خود با شرکت BitMine Immersion Technologies را نهایی...

ادامه مطلب
عملکرد رمزارزها بعد از اعلام آتش‌بس میان ایران و آمریکا

عملکرد رمزارزها بعد از اعلام آتش‌بس میان ایران و آمریکا

۰۲ اردیبهشت ۱۴۰۵
1k
آیا کف بیت‌کوین در ۶۳ هزار دلار ثبت شده است؟

آیا کف بیت‌کوین در ۶۳ هزار دلار ثبت شده است؟

۰۲ اردیبهشت ۱۴۰۵
1k
شوک تنش ایران و آمریکا به بازار کریپتو؛ بیت‌کوین برگشت

شوک تنش ایران و آمریکا به بازار کریپتو؛ بیت‌کوین برگشت

۳۱ فروردین ۱۴۰۵
1k
آیا بیت‌کوین به ۹۰ هزار دلار می‌رسد؟

محرک‌های تازه برای بیت‌کوین؛ آیا رالی بعدی در راه است؟

۲۷ فروردین ۱۴۰۵
1k

درباره ما

نبض ارز

نبض بازار ارزها در دستان شماست



"نبض ارز" مرجع اقتصادی آموزش و اخبار و تحلیل رمزارزهاست که با تکیه بر علم اقتصاد در تلاش است مفاهیم دنیای کریپتو و بلاکچین را از منظری دیگر و جدی تر برای آشنایی و سرمایه گذاری شما عزیزان فراهم آورد.

پربازدیدهای ماه اخیر

  • راهکار های باز کردن قفلی که کلید داخل آن گیر کرده باشد

    کلید داخل قفل گیر کرده و نمی چرخد | راهکار عملی و راحت

    0 اشتراک ها
    اشتراک گذاری 0 توئیت 0
  • هزینه رجیستری گوشی سامسونگ و نحوه رجیستری آن

    0 اشتراک ها
    اشتراک گذاری 0 توئیت 0
  • ثبت نام در صرافی با هدیه ثبت نام

    0 اشتراک ها
    اشتراک گذاری 0 توئیت 0

آخرین‌های نبض‌ارز

  • هشدار ریزش بیت‌کوین؛ تحلیلگران از تکرار سقوط ۲۰۱۸ می‌گویند ۲۷ اردیبهشت ۱۴۰۵
  • ارزش معامله جدید بنیاد اتریوم به ۲۲.۹ میلیون دلار رسید ۱۲ اردیبهشت ۱۴۰۵
  • رشد دوباره کاردانو همزمان با جهش بیت‌کوین به ۷۸ هزار دلار ۰۲ اردیبهشت ۱۴۰۵
  • انباشت بی‌سابقه نهنگ‌ها؛ مقصد بعدی اتریوم کجاست؟ ۰۲ اردیبهشت ۱۴۰۵
  • آمادگی دوج‌کوین برای صعود؛ نهنگ‌ها وارد بازار شدند ۰۲ اردیبهشت ۱۴۰۵

نقشه بازار

  • نبض ارز
  • درباره ما
  • تماس با ما
  • کلاهبرداری ها
  • هوش مصنوعی
  • مدیریت سرمایه و روانشناسی
  • ویکی نبض‌ارز

تمام حقوق مادی و معنوی وبسایت نبض ارز متعلق به مجموعه "نبض ارز" است.

بدون نتیجه
مشاهده تمام نتایج
  • صفحه اصلی
  • آموزش
    • آموزش تحلیل تکنیکال
    • آموزش تحلیل فاندامنتال
    • آموزش کیف پول ها
    • آموزش بلاکچین
  • خبر
    • اخبار بیت کوین
    • اخبار آلت کوین ها
    • اخبار ایردراپ ها
    • اخبار عمومی بازار
  • مقالات
    • مقالات بیت کوین
    • مقالات ایردراپ
    • مقالات بلاکچین
    • مقالات آلت کوین ها
    • مقالات تحلیلی
    • مقالات قانون‌گذاری
  • هوش مصنوعی
  • کلاهبرداری ها
  • مدیریت سرمایه و روانشناسی
  • ویکی نبض ارز
نقشه بازار

تمام حقوق مادی و معنوی وبسایت نبض ارز متعلق به مجموعه "نبض ارز" است.