چرا هوش مصنوعی نمی‌تواند هنر بیافریند؟ پاسخ تد چیانگ به این سوال

آیا هوش مصنوعی مولد می‌تواند هنر یا ادبیات تولید کند؟ این سوالی است که این روزها زیاد پرسیده می‌شود و تد چیانگ، نویسنده‌ی علمی‌تخیلی که فیلم «ورود» (Arrival) از داستان او اقتباس شده، تلاش کرده پاسخی به این سوال بدهد. در نظر او،  برای خلق یک رمان یا نقاشی، هنرمند انتخاب‌هایی انجام می‌دهد که ذاتاً برای هوش مصنوعی بیگانه‌اند. به نقل از خودش:

در سال ۱۹۵۳، رولد دال داستان کوتاهی به نام «صرف‌ونحوکن بزرگ خودکار» (The Great Automatic Grammatizator) را منتشر کرد که درباره‌ی یک مهندس برق بود که در دلش آرزوی نویسنده شدن داشت. روزی، پس از تکمیل ساخت سریع‌ترین ماشین حساب جهان، این مهندس به‌طور ناگهانی متوجه شد که «دستور زبان انگلیسی تابع قوانینی است که تقریباً به اندازه‌ی قواعد ریاضی ساختارمحورند.» بنابراین، او دستگاهی برای داستان‌نویسی می‌سازد که می‌تواند یک داستان کوتاه پنج‌هزار کلمه‌ای را در سی ثانیه تولید کند؛ نوشتن یک رمان برای دستگاه تنها پانزده دقیقه طول می‌کشد و اپراتور آن، مانند کسی که در حال رانندگی یا نواختن ارگ است، با استفاده از دسته‌ها و پدال‌ها، میزان طنز و احساسات نهفته در داستان را تنظیم می‌کند. این رمان‌ها چنان محبوب می‌شوند که در عرض یک سال، نیمی از داستان‌های منتشرشده به زبان انگلیسی محصول اختراع این مهندس هستند.

هوش مصنوعی مولد

آیا هنر ویژگی خاصی دارد که باعث می‌شود نتوان آن را همان‌طور که دال در تخیلش به تصویر کشیده است، صرفاً با فشار دادن یک دکمه خلق کرد؟ در حال حاضر، داستان‌هایی که مدل‌های زبانی بزرگی مانند ChatGPT تولید می‌کنند بسیار ضعیف‌اند، اما می‌توان تصور کرد که این برنامه‌ها در آینده پیشرفت کنند. این پیشرفت تا چه حد می‌تواند باشد؟ آیا ممکن است این مدل‌ها همان‌طور که ماشین‌حساب‌ها در انجام جمع و تفریق از انسان بهتر هستند، در نوشتن داستان، نقاشی یا فیلم‌سازی، از انسان‌ها پیشی بگیرند؟ این در حالی است که استفاده از هوش مصنوعی در فیلم‌ها و به طور کلی دنیای هنر به یک معضل اساسی تبدیل شده است.

دشواری تعریف هنر زبانزد خاص و عام است و بین هنر خوب و بد هم به‌سختی می‌توان تمایز برقرار کرد. اما اجازه دهید یک قاعده‌ی کلی ارائه دهم: هنر چیزی است که از مجموعه‌ای از انتخاب‌ها به وجود آمده است. این موضوع را شاید بتوان با مثال نویسندگی داستان بهتر توضیح داد. هنگام نوشتن داستان، شما – آگاهانه یا ناآگاهانه – در مورد تقریباً هر کلمه‌ای که می‌نویسید یک انتخاب انجام می‌دهید؛ به‌بیان ساده، می‌توان گفت که یک داستان کوتاه ده‌هزارکلمه‌ای مستلزم حدود ده‌هزار انتخاب است. اما وقتی به یک برنامه‌ی هوش مصنوعی مولد (Generative AI) یک فرمان متنی می‌دهید، تعداد انتخاب‌های شما بسیار اندک است؛ اگر یک فرمان صدکلمه‌ای بنویسید، در نهایت حدود صد انتخاب انجام داده‌اید.

اگر یک هوش مصنوعی بر اساس فرمان شما یک داستان ده‌هزارکلمه‌ای تولید کند، ناگزیر باید برای تمام انتخاب‌هایی که شما انجام نداده‌اید جایگزینی در نظر بگیرد. این کار را می‌تواند به روش‌های گوناگونی انجام دهد. یکی از این روش‌ها میانگین‌گیری از انتخاب‌هایی است که نویسندگان دیگر انجام داده‌اند، انتخاب‌هایی که در متونی که در اینترنت پیدا می‌شوند منعکس شده است؛ این میانگین معادل پیش‌پاافتاده‌ترین انتخاب‌های ممکن است و به همین دلیل، متونی که هوش مصنوعی تولید می‌کند اغلب به‌شدت کسالت‌بار هستند. روش دیگر، دستور دادن به برنامه برای تقلید از سبک یک نویسنده‌ی مشخص است، که در نهایت داستانی کاملاً مشتق‌شده تولید می‌کند. در هیچ‌یک از این دو حالت، یک اثر هنری بدیع آفریده نمی‌شود.

به گمان من، همین اصل بنیادین در مورد هنرهای تجسمی نیز صدق می‌کند، هرچند شمردن انتخاب‌هایی که یک نقاش انجام می‌دهد دشوارتر است. نقاشی‌های واقعی حاصل تعداد بی‌شماری تصمیم‌گیری هستند. در مقابل، فردی که از یک برنامه‌ی تبدیل متن به تصویر، مانند دال-ای (Dall-E) استفاده می‌کند، صرفاً فرمانی نظیر «یک شوالیه ملبس به زرهی درخشان با اژدهایی آتش‌افروز می‌جنگد» وارد می‌کند و باقی کار را به برنامه می‌سپارد. (جدیدترین نسخه‌ی دال-ای فرمان‌هایی تا چهار هزار حرف یا چند صد واژه را می‌پذیرد، اما حجم فرمان در حدی نیست که بتوانید با آن تمام جزییات صحنه را توصیف کنید). اغلب انتخاب‌هایی که در تصویر نهایی دیده می‌شود ناگزیر از نقاشی‌های مشابهی که در اینترنت وجود دارد وام گرفته شده‌اند؛ ممکن است تصویر از لحاظ فنی خیره‌کننده باشد، اما فردی که فرمان را وارد کرده نمی‌تواند ادعای خلق آن را داشته باشد.

برخی صاحب‌نظران تصور می‌کنند که مولدهای تصویر به‌اندازه‌ی ظهور عکاسی در گذشته، تأثیری عمیق بر فرهنگ بصری خواهند گذاشت. اگرچه این ایده در نگاه نخست موجه به نظر می‌رسد، اما مقایسه‌ی عکاسی با هوش مصنوعی مولد مستلزم بررسی دقیق‌تری است. گمان می‌کنم هنگامی که عکاسی برای نخستین بار ظهور پیدا کرد، کمتر کسی به آن به چشم رسانه‌ای هنری نگاه می‌کرد، زیرا به نظر نمی‌رسید که در پروسه‌ی عکاسی تصمیمات زیادی گرفته شود؛ تنها کافی بود دوربین را تنظیم کرده و نوردهی را آغاز کنید. اما با گذشت زمان، مردم دریافتند که با دوربین‌ها می‌توان کارهای بسیار متنوعی انجام داد و هنر عکاسی در واقع در همین انتخاب‌های گوناگون نهفته است. شاید همیشه نتوان به‌راحتی ماهیت این انتخاب‌ها را توضیح داد، اما وقتی عکس‌های یک عکاس آماتور را با آثار یک عکاس حرفه‌ای مقایسه می‌کنید، تفاوت به‌وضوح آشکار است.

حال، پرسش این است که آیا در استفاده از یک هوش مصنوعی مولد متن‌به‌تصویر نیز امکان اتخاذ چنین طیف وسیعی از تصمیمات وجود دارد؟ به نظر من، پاسخ منفی است. یک هنرمند – چه دیجیتالی کار کند و چه با رنگ و بوم – در فرآیند خلق یک نقاشی، به‌طور ضمنی تصمیمات بسیار بیشتری می‌گیرد تا آن‌چه در قالب فرمانی چندصدکلمه‌ای به یک مولد تصویر قابل گنجاندن است.

می‌توان فرض را بر این گرفت که روزی مولد متن‌‌به‌تصویری تولید خواهد شد که به شما اجازه می‌دهد در طی نوبت‌های متعدد، ده‌ها هزار واژه را داخل کادر فرمان بنویسید تا کنترلی بسیار دقیق و پرجزییات روی تصویری که تولید می‌شود به دست بیاورید؛ این مولد را می‌توان به نسخه‌ای از فوتوشاپ تشبیه کرد که تنها از راه متن کنترل می‌شود. می‌توان گفت که فردی که از چنین برنامه‌ای استفاده کند، همچنان سزاوار عنوان هنرمند است. کارگردان سینما، بنت میلر (Bennett Miller)، از DALL-E 2 برای خلق تصاویری چشمگیر استفاده کرد که در گالری گاگوسیان (Gagosian Gallery) به نمایش درآمدند؛ او برای تولید این آثار، فرمان‌های متنی دقیقی تنظیم کرد و سپس به دال-ای دستور داد تصویرهای تولیدشده را بارها و بارها اصلاح و دستکاری کند. او بیش از صدهزار تصویر تولید کرد و از بین آن‌ها بیست تصویر نهایی را که به نمایشگاه راه پیدا کردند انتخاب کرد. با این حال، میلر اذعان کرده که در نسخه‌های جدیدتر دال-ای موفق به دستیابی به نتایجی مشابه نشده است. احتمال می‌دهم که دلیل این امر آن باشد که میلر از دال-ای برای کاری استفاده می‌کرد که اساساً برای آن طراحی نشده بود؛ گویی که او نرم‌افزار ساده‌ای مانند مایکروسافت پینت را هک کرده بود تا رفتاری مشابه فوتوشاپ از خود نشان دهد، اما به محض انتشار نسخه‌ی جدیدی از پینت، ترفندهای هکری او دیگر کارایی گذشته را نداشتند.

هوش مصنوعی مولد

سه تا از عکس‌هایی که بنت میلر برای گالری گوگوسیان با هوش مصنوعی مولد Dall-E 2 تولید کرد. – عکس ۱

هوش مصنوعی مولد

عکس ۲

هوش مصنوعی مولد

عکس ۳

احتمالاً OpenAI در تلاش نیست محصولی برای کاربرانی مانند میلر بسازد، زیرا محصولی که کاربر برای تولید یک تصویر با آن باید چند ماه وقت بگذارد، برای بیشتر مخاطبان جذابیت نخواهد داشت. این شرکت به دنبال ارائه‌ی محصولی است که تصاویر را با کمترین زحمت تولید کند.

تصور برنامه‌ای که در نوبت‌های متعدد به شما در نوشتن یک رمان خوب کمک کند، دشوارتر است. چنین برنامه‌ی فرضی ممکن است از شما بخواهد که یک فرمان ورودی صد هزار کلمه‌ای وارد کنید تا بتواند صد هزار واژه‌ی کاملاً متفاوت تولید کند و رمانی را که در ذهن دارید، پدید آورد. اما چنین برنامه‌ای دقیقاً چگونه عمل خواهد کرد؟ مشخص نیست. از لحاظ نظری، اگر چنین برنامه‌ای وجود داشت، شاید بتوان گفت که کاربر همچنان شایسته‌ی لقب نویسنده بود. اما باز هم به نظر نمی‌رسد که شرکت‌هایی مانند OpenAI علاقه‌ای به ساخت نسخه‌هایی از ChatGPT داشته باشند که همان‌قدر از کاربران زمان و تلاش بطلبد که نوشتن یک رمان از صفر نیاز دارد. نکته‌ی تبلیغاتی هوش مصنوعی مولد این است که خروجی آن‌ها بسیار گسترده‌تر و حجیم‌تر از ورودی‌ای است که شما بهشان می‌دهید و دقیقاً همین ویژگی است که مانع از تبدیل شدن آن‌ها به ابزاری موثر برای هنرمندان می‌شود.

شرکت‌هایی که از برنامه‌های هوش مصنوعی مولد حمایت می‌کنند، ادعا دارند که این فناوری خلاقیت را شکوفا خواهد کرد. به بیان ساده، آن‌ها می‌گویند که هنر می‌تواند کاملاً حاصل الهام‌گیری باشد و هیچ زحمتی نداشته باشد، اما این دو عنصر را نمی‌توان به‌راحتی از هم جدا کرد. حرف من این نیست که هنر باید الزاماً همراه با ملال و رنج باشد. بلکه معتقدم که هنر در هر مقیاسی نیازمند اتخاذ تصمیمات است؛ انتخاب‌های ریز و بی‌شماری که در مرحله‌ی آفرینش هنر انجام می‌شوند، به اندازه‌ی چند انتخاب کلیدی و کلانی که در مرحله‌ی ایده‌پردازی انجام می‌شوند، در محصول نهایی تاثیر دارند. در فرآیند آفرینش اثر هنری، این یک اشتباه اساسی است که مقیاس بزرگ را مترادف با اهمیت تلقی کنیم؛ چرا که جوهره‌ی هنر در تعامل میان تصمیمات در مقیاس بزرگ و مقیاس کوچک نهفته است.

باور به اینکه الهام‌گیری از هر عامل دیگری مهم‌تر است، به گمان من، نشانه‌ای از ناآشنایی فرد با آن رسانه‌ی خاص است. چنین مسئله‌ای حتی در صورتی که هدف، تولید اثری سرگرم‌کننده باشد و نه یک شاهکار هنری، همچنان صدق می‌کند. مردم اغلب میزان تلاش مورد نیاز برای خلق یک اثر سرگرم‌کننده را دست‌کم می‌گیرند؛ یک رمان هیجانی شاید به آرمان کافکا از یک کتاب («تبری بر دریای یخ‌زده‌ی درونمان») نزدیک نشود، اما همچنان ممکن است دقت یک ساعت سوئیسی در نوشته شدن آن به کار رفته باشد. یک رمان مهیج موفق، چیزی فراتر از طرح و ایده‌ی اولیه‌ی خود است. نمی‌توان تمام جملات یک رمان تریلر را با جملاتی که از لحاظ معنایی معادل آن‌ها هستند جایگزین کرد و همچنان انتظار داشت که اثر به همان اندازه سرگرم‌کننده باشد. این یعنی جملات و انتخاب‌های ظریفی که در مقیاس کوچک انجام می‌شوند، نقشی تعیین‌کننده در اثربخشی نهایی یک اثر دارند.

بسیاری از رمان‌نویسان تجربه‌ی رویارویی با افرادی را داشته‌اند که با اطمینان ادعا می‌کنند ایده‌ی شگفت‌انگیزی برای یک رمان دارند و حاضرند آن را در ازای تقسیم پنجاه‌پنجاه سود فروش آن، با نویسنده به اشتراک بگذارند. چنین افرادی ناخواسته نشان می‌دهند که گمان می‌کنند جمله‌پردازی یک کار اضافی و کسل‌کننده است، نه بخشی بنیادی از قصه‌گویی در قالب نثر. هوش مصنوعی مولد برای کسانی جذاب است که تصور می‌کنند می‌توانند در یک رسانه‌ی هنری ابراز وجود کنند، بدون آن‌که واقعاً در آن رسانه کار کنند. اما خالقان رمان‌های سنتی، نقاشی‌ها و فیلم‌ها، به این هنرها جذب می‌شوند زیرا در هر یک از این رسانه‌ها امکان بیانی منحصربه‌فرد را می‌بینند. آن‌ها به دلیل اشتیاق‌شان برای بهره‌گیری کامل از این امکانات است که از خلق آثار خود، چه در مقام هنر و چه در مقام سرگرمی، احساس رضایت می‌کنند.

البته، بیشتر نوشته‌ها – از مقالات گرفته تا گزارش‌ها و ایمیل‌ها – با این پیش‌فرض که هزاران انتخاب در پس تولیدشان نهفته است، تولید نمی‌شوند. در چنین مواردی، آیا خودکارسازی نوشتار آن‌ها ضرری دارد؟ اجازه دهید یک قاعده‌ی کلی دیگر را پیشنهاد کنم: هر نوشته‌ای که ارزش توجه شما را به‌عنوان خواننده داشته باشد، نتیجه‌ی تلاش نویسنده‌ی آن است. البته تلاش کردن لزوماً به معنای ارزشمند بودن محصول نهایی نیست، اما هیچ اثر ارزشمندی بدون تلاش به‌وجود نمی‌آید. نوع توجهی که هنگام خواندن یک ایمیل شخصی صرف می‌کنید، با نوع توجهی که به خواندن یک گزارش تجاری اختصاص می‌دهید، متفاوت است، اما در هر دو مورد، تنها زمانی این توجه موجه است که نویسنده برای نوشتن آن فکر و انرژی صرف کرده باشد.

اخیراً، گوگل در جریان المپیک پاریس، تبلیغی برای جمنای (Gemini)، رقیب خود برای GPT-4 شرکت OpenAI پخش کرد. در این تبلیغ، پدری با استفاده از جمنای یک نامه‌ی هواداری از طرف دخترش می‌نویسد تا دخترش آن را برای ورزشکاری که الهام‌بخش اوست بفرستد. اما گوگل پس از واکنش‌های منفی گسترده از سوی مخاطبان، این تبلیغ را حذف کرد؛ یک استاد رسانه، آن را «یکی از نگران‌کننده‌ترین تبلیغاتی که تاکنون دیده‌ام» توصیف کرد. نکته‌ی قابل توجه این است که این واکنش‌ها حتی در شرایطی رخ داد که موضوع مورد بحث، خلاقیت هنری نبود. کسی انتظار ندارد که نامه‌ی هواداری یک کودک به یک ورزشکار، اثری خارق‌العاده باشد؛ اگر این دختر خودش نامه را نوشته بود، احتمالاً نوشته‌ی او تفاوتی با هزاران نامه‌ی مشابه دیگر نداشت. اما اهمیت چنین نامه‌ای – چه برای کودکی که آن را می‌نویسد و چه برای ورزشکاری که آن را دریافت می‌کند – در این نیست که نامه چقدر شیوا نوشته شده، بلکه در این است که از دل برآمده است.

بسیاری از ما کارت‌های تبریک آماده برای دیگران ارسال کرده‌ایم، در حالی که می‌دانستیم دریافت‌کننده متوجه خواهد شد که خودمان کلمات روی آن را ننوشتیم. اما هیچ‌کس جملات روی کارت‌های هالمارک (Hallmark)  را با دست‌خط خود بازنویسی نمی‌کند، زیرا چنین کاری حالتی فریب‌کارانه دارد. برنامه‌نویسی به نام سایمون ویلیسون (Simon Willson)، فرآیند آموزش مدل‌های زبانی بزرگ را «پولشویی داده‌های دارای کپی‌رایت» توصیف کرده است و این تعبیر، راهی مفید برای درک جذابیت هوش مصنوعی مولد ارائه می‌دهد: این فناوری به شما امکان می‌دهد که نوعی سرقت ادبی انجام دهید، اما بدون آن‌که احساس گناه کنید، زیرا حتی برای خود شما هم روشن نیست که دقیقاً در حال کپی کردن چه چیزی هستید.

برخی استدلال می‌کنند که مدل‌های زبانی بزرگ، به جای «پولشویی» متون آموزشی، از آن‌ها یاد می‌گیرند، درست همان‌طور که نویسندگان انسانی از کتاب‌هایی که خوانده‌اند، آموخته‌اند. اما یک مدل زبانی بزرگ، نویسنده نیست؛ حتی کاربر زبان هم نیست. طبق تعریف، زبان یک سامانه‌ی ارتباطی است و برای به کار برده شدن، باید قصد ارتباط با آن را داشته باشید. قابلیت تکمیل خودکار (Autofill) در تلفن شما ممکن است پیشنهادهای خوب یا پیشنهادهای بدی برای پیغام فرستادن به شما بدهد، اما در هیچ موقعیتی تلاش نمی‌کند از جانب خودش چیزی را به شما یا به فردی که در حال ارسال پیام به او هستید منتقل کند. توانایی چت‌جی‌پی‌تی در تولید جملات منسجم، شاید این تصور را در ذهن ما ایجاد کند که تفاوتی بنیادین با قابلیت تکمیل خودکار اسمارت‌فون‌هایمان دارد، اما در واقعیت، این مدل، مثل قابلیت تکمیل خودکار، هیچ‌گونه قصد ارتباطی ندارد.

دستور دادن بهChatGPT  برای ایجاد عبارتی مانند «از دیدنت خوشحالم» بسیار ساده است. بسیاری از جنبه‌های عملکرد مدل‌های زبانی بزرگ هنوز برای ما مبهم است، اما یک چیز را با اطمینان می‌دانیم: چت‌جی‌پی‌تی از دیدن من و شما خوشحال نیست. یک سگ می‌تواند احساس خوشحالی از دیدن شما را ابراز کند؛ و همین‌طور کودکی که هنوز زبان نیاموخته است. این دو موجود بدون این‌که شیوه‌ی استفاده از کلمات را بلد باشند، احساسی را به شما منتقل می‌کنند. اماChatGPT  نه احساسی دارد و نه چیزی می‌خواهد، و دقیقاً همین نداشتن قصد ارتباطی است که باعث می‌شود آن را کاربر زبان ندانیم. آنچه عبارت «از دیدنت خوشحالم» را به یک جمله‌ی زبانی تبدیل می‌کند، صرفاً ساختار صحیح آن نیست، بلکه قصد و نیت برقراری ارتباط است که در پس این جمله نهفته است.

هوش مصنوعی مولد

از آنجا که زبان برای ما امری بدیهی و طبیعی به نظر می‌رسد، اغلب فراموش می‌کنیم که این توانایی، بر پایه‌ی تجربه‌های بنیادین‌تری مانند احساسات درونی و میل به برقراری ارتباط شکل گرفته است. هنگامی که یک مدل زبانی بزرگ جملاتی منسجم تولید می‌کند، وسوسه می‌شویم ویژگی‌های انسانی را به آن نسبت دهیم، اما در واقع، این فقط شبیه‌سازی است. این پدیده همانند مکانیزمی است که باعث می‌شود برخی پروانه‌ها لکه‌های تیره‌ی بزرگی روی بال‌های خود داشته باشند، لکه‌هایی که پرندگان را فریب می‌دهند تا آن‌ها را با شکارچیانی با چشمان بزرگ اشتباه بگیرند. در این شرایط، همین شبیه‌سازی کافی است؛ پرندگان کمتر به این پروانه‌ها حمله می‌کنند، و برای پروانه اهمیتی ندارد که چرا زنده مانده است؛ تنها چیزی که مهم است، ادامه‌ی حیات اوست. اما تفاوتی عمیق میان یک پروانه و یک شکارچی واقعی که تهدیدی برای پرنده محسوب می‌شود، وجود دارد.

فردی که از هوش مصنوعی مولد برای کمک گرفتن در نوشتن استفاده می‌کند، ممکن است ادعا کند که صرفاً از متونی که مدل بر اساس آن‌ها آموزش دیده، الهام می‌گیرد. اما این ادعا تفاوتی اساسی با فرآیند الهام گرفتن یک نویسنده از نویسنده‌ی دیگر دارد. تصور کنید که یک دانشجو، مقاله‌ای تحویل دهد که صرفاً شامل یک نقل‌قول پنج‌صفحه‌ای از یک کتاب است و استدلال کند که این نقل‌قول، دقیقاً همان چیزی را بیان می‌کند که او می‌خواست بگوید، آن هم به شکلی بهتر از آنچه خودش می‌توانست بنویسد. حتی اگر این دانشجو کاملاً روراست باشد و به استادش توضیح دهد که چه کرده است، نمی‌توان گفت که او واقعاً از این کتاب الهام گرفته است. اینکه یک مدل زبانی بزرگ بتواند آن نقل‌قول را تا حدی بازنویسی کند که منبع اصلی آن غیرقابل شناسایی شود، تغییری در ماهیت آنچه رخ داده، ایجاد نمی‌کند.

همان‌طور که زبان‌شناسی به نام امیلی ام. بندر (Emily M. Bender) اشاره کرده است، دلیل این‌که معلمان از دانش‌آموزان‌شان می‌خواهند مقاله بنویسند این نیست که جهان به مقاله‌های بیشتری نیاز دارد. هدف از نوشتن مقاله، تقویت مهارت‌های تفکر انتقادی فرد است؛ همان‌طور که دمبل زدن برای انجام هر ورزشی مفید است، نوشتن مقاله نیز مهارت‌هایی را تقویت می‌کند که در هر شغلی که یک دانشجو در آینده به دست آورد، ضروری خواهند بود. استفاده از ChatGPT برای انجام تکالیف، مانند آوردن یک لیفتراک به داخل سالن وزنه‌برداری است؛ با این کار، توانایی ذهنی شما هرگز تقویت نخواهد شد.

البته لازم نیست همه‌ی نوشته‌ها خلاقانه، صمیمانه یا حتی باکیفیت باشند؛ گاهی اوقات، تنها کافی است که وجود داشته باشند. این نوع از نوشته‌ها می‌توانند اهداف دیگری را دنبال کنند، مانند جذب مخاطب برای تبلیغات یا برآورده کردن الزامات اداری. در چنین شرایطی، نمی‌توانیم آدم‌ها را سرزنش کنیم که چرا از ابزارهای در دسترس، برای سرعت بخشیدن به کار خود استفاده می‌کنند. اما آیا دنیایی که پر از متونی باشد که با حداقل تلاش تولید شده‌اند، جای بهتری خواهد بود؟

این ادعا که پرهیز از استفاده از مدل‌های زبانی بزرگ نیاز به تولید متون دم‌دستی را از بین خواهد برد غیرواقع‌بینانه است. اما آنچه اجتناب‌ناپذیر به نظر می‌رسد، این است که هرچه بیشتر از این مدل‌ها برای برآورده کردن این نیازها استفاده کنیم، این نیازها نیز بیشتر خواهند شد. ما در حال ورود به دوره‌ای هستیم که در آن ممکن است فردی از یک مدل زبانی برای تبدیل یک لیست گلوله‌ای به یک متن کامل و یک‌پارچه استفاده کند و سپس شخص دیگری همان متن را با یک مدل زبانی دیگر دوباره به لیستی از نکات کلیدی تبدیل کند.  آیا کسی واقعاً می‌تواند ادعا کند که این پیشرفت محسوب می‌شود؟

هوش مصنوعی مولد

این احتمال وجود دارد که روزی برنامه‌های کامپیوتری بتوانند هر کاری را که یک انسان انجام می‌دهد انجام دهند، اما برخلاف ادعاهای شرکت‌های تبلیغ‌کننده‌ی هوش مصنوعی، چنین چیزی در چند سال آینده اتفاق نخواهد افتاد. حتی در حوزه‌هایی که هیچ ارتباطی با خلاقیت ندارند، مدل‌های هوش مصنوعی کنونی محدودیت‌های عمیقی دارند که باعث می‌شود با تردید به این سؤال نگاه کنیم که آیا واقعاً شایسته‌ی صفت «هوشمند» هستند یا نه؟

فرانسوا شوله (François Chollet) دانشمند علوم کامپیوتر، تمایز جالبی را مطرح کرده است: مهارت به کیفیت اجرای یک وظیفه مربوط می‌شود، در حالی‌که هوش یعنی توانایی یادگیری مهارت‌های جدید به‌طور کارآمد. این تعریف با درک شهودی ما از هوش انسانی سازگار است؛ بیشتر افراد می‌توانند با تمرین کافی، یک مهارت جدید را بیاموزند، اما هرچه سرعت یادگیری فرد بیشتر باشد، او را باهوش‌تر تلقی می‌کنیم.

نکته‌ی جالب درباره‌ی این تعریف این است که برخلاف آزمون‌های ضریب هوشی (IQ)، نه‌تنها برای انسان‌ها، بلکه برای موجودات غیرانسانی نیز قابل‌استفاده است. مثلاً اگر یک سگ خیلی سریع ترفندی جدید را یاد بگیرد، این را نشانه‌ای از هوش او در نظر می‌گیریم.

در سال ۲۰۱۹، پژوهشگران آزمایشی انجام دادند که در آن سعی داشتند به موش‌ها رانندگی بیاموزند. آن‌ها موش‌ها را در جعبه‌های پلاستیکی کوچکی قرار دادند که سه نوار سیمی مسی داشتند. وقتی موش‌ها با پنجه‌هایشان یکی از این نوارها را لمس می‌کردند، جعبه یا به سمت جلو حرکت می‌کرد یا به چپ و راست می‌چرخید. موش‌ها که بشقابی از غذا را در طرف دیگر اتاق می‌دیدند، سعی می‌کردند وسیله‌ی نقلیه‌ی خود را به سمت آن هدایت کنند. پژوهشگران این موش‌ها را در جلسات پنج‌دقیقه‌ای آموزش دادند و بعد از بیست‌وچهار جلسه‌ی تمرینی، آن‌ها به رانندگان ماهری تبدیل شدند.

بیست‌وچهار جلسه تمرین، برای آموزش موفقیت‌آمیز مهارتی که در کل تاریخ تکاملی موش‌ها وجود نداشته است کفایت کرد. آیا این تعریفی از هوش نیست؟

حالا برنامه‌های هوش مصنوعی کنونی را در نظر بگیرید؛ همان‌هایی که به‌خاطر عملکردشان به‌شدت تحسین شده‌اند. آلفازیرو (AlphaZero)، برنامه‌ای که دیپ‌مایند (Deepmind)، یکی از زیرمجموعه‌های گوگل آن را توسعه داده، بهتر از هر انسانی شطرنج بازی می‌کند، اما در طول دوره‌ی آموزش خود چهل‌وچهار میلیون بازی انجام داده است، رقمی که هیچ انسانی در طول عمرش به آن نخواهد رسید. اگر این هوش‌مصنوعی بخواهد در یک بازی جدید استاد شود، باید به‌تناسب وقت برای آموزش دیدنش گذاشت.

بر اساس تعریف شوله، برنامه‌هایی مثل آلفازیرو دارای مهارت بالایی هستند، اما هوش چندانی ندارند، زیرا در یادگیری مهارت‌های جدید چندان کارآمد نیستند. در حال حاضر، نوشتن برنامه‌ای که بتواند حتی یک وظیفه‌ی ساده را در تنها طی ۲۴ تلاش بیاموزد – بدون اینکه اطلاعاتی از قبل در اختیارش گذاشته شود – غیرممکن است.

نمونه‌ی دیگر: خودروهای خودران. این خودروها با وجود این‌که میلیون‌ها کیلومتر رانندگی را در داده‌های آموزشی خود دارند، همچنان ممکن است با تریلی‌ای که واژگون شده است برخورد کنند، چون این وضعیت در داده‌های آموزشی‌شان رایج نیست. در مقابل، یک انسان در نخستین جلسه‌ی آموزش رانندگی هم خواهد دانست که با دیدن چنین صحنه‌ای باید توقف کند.

آنچه میزان هوشمندی ما انسان‌ها را تعیین می‌کند، نه توانایی ما در حل مسائل جبر، بلکه توانایی ما در وفق دادن خودمان با شرایط ناآشناست. کامپیوترها تا زمانی که چنین قابلیتی را به دست نیاورند، قادر نخواهند بود جایگزین انسان‌ها شوند و این مسیر هنوز بسیار طولانی است. در حال حاضر، ما تنها به‌دنبال یافتن مشاغلی هستیم که بتوان آن‌ها را با قابلیت تکمیل خودکار تسریع‌شده انجام داد.

باوجود تمام هیاهوها، تاثیر هوش مصنوعی مولد بر افزایش چشمگیر بهره‌وری اقتصادی همچنان در حد نظریه باقی مانده است. اوایل امسال، گلدمن ساکس گزارشی با عنوان «هوش مصنوعی مولد: هزینه‌ی بیش از حد، سود بسیار اندک؟» منتشر کرد.

بزرگ‌ترین موفقیت این فناوری نه در بهبود تولید محتوا، بلکه در کاهش انتظارات ما نهفته است؛ هم پیرامون آنچه می‌خوانیم و هم پیرامون آنچه هنگام نوشتن برای دیگران تولید می‌کنیم. این فناوری اساساً هویتی ضدانسانی دارد، زیرا ما را کمتر از آنچه که هستیم – آفرینندگان و درک‌کنندگان معنا –  می‌پندارد. هوش مصنوعی، میزان «قصد و نیت» را در جهان کاهش می‌دهد.

برخی افراد با این استدلال که بیشتر آنچه انسان‌ها می‌گویند یا می‌نویسند، چندان اصیل نیست، از مدل‌های زبانی بزرگ دفاع کرده‌اند. این ادعا درست است، اما بی‌ربط. وقتی کسی به شما می‌گوید «عذر می‌خواهم»، مهم نیست که پیش از این، افراد بی‌شماری این جمله را بر زبان آورده‌اند؛ مهم نیست که «عذر می‌خواهم» از نظر آماری یک رشته‌ی متداول از کلمات باشد. اگر این عذرخواهی صادقانه باشد، ارزشمند و معنادار است، حتی اگر عذرخواهی، پیش از این دفعات بی‌شماری بیان شده باشد. به همین ترتیب، اگر به دوستی بگویید «خوشحالم که تو را می‌بینم»، حرفی پرمعنا زده‌اید، حتی اگر این جمله فاقد تازگی باشد.

همین منطق در مورد هنر نیز صدق می‌کند. فرقی ندارد که در حال نوشتن رمان، خلق نقاشی یا ساختن یک فیلم باشید؛ شما در حال برقراری ارتباط با مخاطب خود هستید. لازم نیست اثر شما از هرآنچه در تاریخ هنر خلق شده، کاملاً متمایز باشد تا ارزشمند باشد؛ آنچه به آن معنا می‌بخشد، این است که شما آن را گفته‌اید. این اثر، برخاسته از تجربه‌ی منحصربفرد شما از زندگی است و در لحظه‌ای خاص از زندگی مخاطب شما به او می‌رسد؛ همین نکته، آن را جدید و معنادار می‌سازد. همه‌ی ما محصول آنچه پیش از خودمان وجود داشته هستیم، اما این زیستن ما در تعامل با دیگران است که به جهان معنا می‌بخشد. این کاری است که یک الگوریتم تکمیل خودکار هرگز قادر به انجام آن نیست؛ نگذارید کسی خلاف این را به شما بگوید.

منبع: نیویورکر

انتشار یافته در:

مجله‌ی اینترنتی دیجی‌کالا

۵/۵ - (۲ امتیاز)
4 پاسخ

دیدگاه خود را ثبت کنید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

  1. OX0408KD گفته:

    سلام فربد. خوشحالم برگشتم این جا و دوباره شاهد مطالب معرکه ات هستم. راستش این متن خاص رو هنوز شروع نکردم ولی تو خود تیتر، فرضی پنهان شده که می شه سرش بحث کرد. سوال طرح شده این نیست که آیا هوش مصنوعی می تواند اثر هنری خلق کند یا نمی تواند؟ سوال اینه که چرا نمی تواند؟ و این سوال کمی موذیانه ست. چرا هوش مصنوعی نمی تواند اثر هنری خلق کند؟ بذار با یه سوال دیگه جوابش رو بدیم. چرا نود درصد فیلم ها و سریال ها و رمان های تولیدشده در سال اثر هنری نیستن؟ ببین من حسی که از “کشته شدن جسی جیمز بدست رابرت فورد بزدل” می گیرم، حس هوش و خلاقیت هنری یگانه و خالص، از “ترون ارس” نمی گیرم. از فیلم فیک “نورنبرگ” نمی گیرم که آدما فقط در سطح دیالوگ های مقوایی باهوشن و هیچ چیز دیگه فیلم باهوش نیست. چرا هوش مصنوعی نمی تواند؟ خب، مگه نود درصد انسان های شاغل در کار خلاقه می توانند؟ (و فراموش نکن که درصدی از این جمعیت توی ایران خودمون زندگی می کنن، همین رمان های دوزاری، همین فیلم های با بودجه هنگفت که سردر سینماها هستن). مسئله این نیست که هوش مصنوعی می تونه یا نه. هوش مصنوعی هنوز به طور دقیق خودآگاه نیست. یه مدل زبانیه که داده ها رو به شکل بی سابقه به هم متصل می کنه و نتیجه رو با زبان، انسانی جلوه میده. در حد تصویرش توی فیلم های سینمایی نیست. هنوز یه کودک نوپاست. اما قطعا هنرمندان بزرگ تاریخ هم تو هفت هشت سالگی نمی تونستن کارهای بزرگشون رو بسازن. مسئله اینه که تو نسخه فعلی کی داره پرامپت می نویسه. برو پشت دستگاه و تایپ کن:«ازت می خوام زیباترین متن/فیلم کوتاه غم انگیز تاریخ رو بنویسی/بسازی» چیزی که بهت می ده ماشینی ترین و احمقانه ترین نتیجه ممکنه. ولی به جای این براش چند تا نمونه متن بذار، جزئیات رو توضیح بده، بحث کن و بعد ازش بخواه. حیرت زده ات می کنه. یکبار ازش خواستم یه متن طولانی، سرد، فلیپ کی دیکی از زبان یه مامور سابق بنویسه که حالا تو سال ۲۰۵۰ تحت تعقیبه و تو یه جهان پارانوئید زندگی می کنه. ذهنش داره زایل می شه و سعی می کنه ترس و درد رو با دزهای پایین موادمخدر کنترل کنه. چیزی نوشت که دیوانم کرد. انگار خود کی دیک زنده شده باشه و ۲۵ سال بعد رو از دید امروز پیش بینی کنه. داده ها رو تو بهش می دی ولی اونه که مجسمه رو تحویلت می ده. فکر کنم برسون یکبار گفته بود:«اثر هنری با خلق شکل نمی گیره، با حذف شکل می گیره»

    پاسخ
    • Beowolf گفته:

      دقیقا پرامپتی که گفتی رو بهش دادم. قضاوت کنین هنره یا نه:
      “ساعت‌ها دیگه به شکل عدد درنمیان. تکه‌تکه‌ان، مثل خاطره‌هایی که نصفه می‌سوزن و نصفه زنده می‌مونن. می‌گن سال ۲۰۵۰ـه، ولی من دیگه به سال‌ها اعتماد ندارم. زمان هم مثل بقیه چیزها جعل شده. یه پروتکل قدیمیه برای رام نگه‌داشتن ذهن‌ها.

      من مامور بودم. «بودم» فعل خطرناکیه؛ چون هنوز دقیق نمی‌دونم تموم شده یا نه. تو پرونده‌هام، وضعیت من رو «غیرفعالِ متخاصم» ثبت کردن. یعنی نفس می‌کشم، ولی نباید.

      جهان الان روی سوءظن کار می‌کنه. همه‌چیز با این فرض ساخته شده که تو دروغ می‌گی. دیوارها گوش دارن، دستگاه‌ها خواب ندارن، و آدم‌ها… آدم‌ها بیشتر از همه خطرناکن، چون هنوز وانمود می‌کنن انسانن. من یاد گرفتم مستقیم نگاه نکنم. چشم‌ها لو می‌دن. نه فقط تو رو؛ خودت رو هم.

      ذهنم داره می‌ریزه. نه یه‌هو، نه دراماتیک. آهسته، مثل نم دیوار. اسم‌ها اول می‌رن. بعد ترتیب وقایع. بعد مطمئن نیستی اون‌چه یادت میاد، واقعاً اتفاق افتاده یا تزریق شده. ما خودمون این تکنولوژی رو ساختیم. برای بازجویی. برای «پاک‌سازی نرم». حالا همون ابزارها دارن من رو بازجویی می‌کنن، بدون اینکه کسی اون‌طرف میز نشسته باشه.

      درد همیشه هست. نه درد فیزیکیِ واضح؛ یه فشار دائم پشت چشم‌ها، یه وزوز توی جمجمه. ترس هم همین‌طوره. ترس از اینکه الان، همین الان، یه الگوریتم به این نتیجه برسه که من هنوز ارزش تعقیب دارم. برای همین دزها رو پایین نگه می‌دارم. خیلی پایین. فقط در حدی که لبه‌ها رو کند کنه، نه بیشتر. نمی‌خوام خاموش شم. خاموشی یعنی بی‌دفاعی.

      مواد رو دوست ندارم. هیچ‌وقت دوست نداشتم. ما تو واحد، بهش می‌گفتیم «تنظیم‌کننده». اسم‌ها رو عوض می‌کردیم تا وجدان‌مون رو دور بزنیم. حالا خودم دارم همون بازی رو با خودم می‌کنم. می‌گم «درمان». می‌گم «کنترل علائم». ولی تهش می‌دونم دارم فقط چند ساعت دیگه می‌خرم که بتونم تشخیص بدم کدوم فکر مال خودمه.

      بعضی شب‌ها مطمئنم که تعقیب می‌شم. بعضی شب‌ها مطمئن‌ترم که نمی‌شم، و اون دومی خطرناک‌تره. چون سیستم همیشه وقتی کار می‌کنه که تو فکر می‌کنی خاموشه. ما این رو می‌دونستیم. من امضا کرده بودم پای این دکترین.

      حافظه‌هام شروع کردن به حرف زدن با هم. یه نسخه از من می‌گه من خیانت کردم. یه نسخه دیگه می‌گه من فقط زودتر فهمیدم. نمی‌دونم کدومشون واقعی‌تره. شاید هیچ‌کدوم. شاید حقیقت یه فایل فشرده‌ست که کلیدش رو گم کردم.

      گاهی شک می‌کنم اصلاً مامور بوده‌ام یا نه. شاید این هم یه داستانه که برای توجیه این تعقیب ساخته شده. شاید من یه تستم. یه ذهنِ در حال فروپاشی که دارن واکنشش رو به پارانویا اندازه می‌گیرن. تو این دنیا، حتی رنج هم می‌تونه آزمایش باشه.

      یه قانون نانوشته هست: هرچی بیشتر بفهمی، کمتر واقعی می‌شی. من زیادی فهمیدم. برای همین حالا دارم محو می‌شم. اسمم از پایگاه‌ها پاک شده، ولی رد عصبی‌ام هنوز فعاله. این بدترین حالته: وجود داشتن بدون شناسایی رسمی.

      اگه این متن رو می‌خونی، یا خیلی دیر شده یا خیلی زود. من دیگه مطمئن نیستم نوشتن واقعاً ثبت می‌شه یا فقط توی حلقه بسته ذهنم پخش می‌شه. ولی نوشتن هنوز تنها کاریه که سیستم کامل تصاحبش نکرده. هنوز.

      دز بعدی رو شاید فردا بخورم. یا دیروز خورده‌ام. مهم نیست. مهم اینه که تا وقتی درد و ترس رو دقیق تنظیم کنم، هنوز یه تکه کوچیک از من دست‌نخورده می‌مونه. همون تکه‌ای که می‌دونه این جهان اشتباه ساخته شده.

      و اشتباه‌ها، هرچقدر هم پنهان بشن، بالاخره لو می‌رن. مثل من.”
      به نظر خودم پاراگرافای آخر یه مقدار خراب می کنه . کلا هوش مصنوعی مشکلش همینه . میفته توی یک لوپ و باید مدام بهش پرامپت بدی و تکه های مختلفو بهم بچسبونی تا یه اثر زیبا تحویل بگیری.

      پاسخ
  2. بینام گفته:

    سلام فربد جان. دستت درد نکنه چه مقالۀ خوبی و به چه خوبی ترجمه کردی. کاش نام نویسنده را از قلم نمی انداختی و به لینک دادن منبع اکتفا نمیکردی. چخبر از کارهای جدیدت؟ (if any

    پاسخ