مروری جامع بر هوش مصنوعی: از یادگیری ماشین تا مدل‌های زبانی بزرگ

هوش مصنوعی (AI) نمایانگر حوزه‌ای تحول‌آفرین در علوم کامپیوتر است که از مفاهیم نظری به کاربردهای عملی در صنایع متعدد تکامل یافته است. این مقاله به بررسی تعریف بنیادین هوش مصنوعی پرداخته و روابط آن را با یادگیری ماشین، یادگیری عمیق، هوش مصنوعی مولد و مدل‌های زبانی بزرگ روشن می‌سازد. این فناوری‌ها ساختاری سلسله‌مراتبی را تشکیل می‌دهند که در آن هر فناوری بعدی بر قابلیت‌های پیشینیان خود بنا شده و آن‌ها را تخصصی‌تر می‌کند و بدین ترتیب اکوسیستمی از رویکردهای محاسباتی به‌طور فزاینده پیچیده برای حل مسائل دشوار ایجاد می‌کند.

تعریف و دامنه هوش مصنوعی

هوش مصنوعی، به عنوان زیرشاخه‌ای از علوم کامپیوتر، با هدف ایجاد ماشین‌های هوشمندی است که قادر به انجام وظایفی هستند که معمولاً به هوش انسانی نیاز دارند. مفهوم بنیادین بر این فرض استوار است که هوش انسانی را می‌توان به اندازه کافی تعریف کرد تا ماشین‌ها بتوانند از آن تقلید کنند. در هسته خود، هوش مصنوعی شامل سیستم‌هایی متشکل از اجزای سخت‌افزاری و نرم‌افزاری است که برای پردازش اطلاعات، یادگیری از تجربیات و اتخاذ تصمیمات هوشمندانه طراحی شده‌اند.

حوزه هوش مصنوعی از زمان پیدایش خود به‌طور قابل توجهی تکامل یافته و از سیستم‌های خبره ساده مبتنی بر قوانین به الگوریتم‌های یادگیری پیچیده حرکت کرده است. تحقیقات اولیه هوش مصنوعی بر سیستم‌های پردازش نمادین متمرکز بود که می‌توانستند اعداد و نمادها را با سهولت یکسان دستکاری کنند. این رویکرد انحراف قابل توجهی از محاسبات سنتی بود که عمدتاً بر محاسبات عددی تمرکز داشت.

امروزه، هوش مصنوعی شامل فناوری‌های مختلفی از جمله یادگیری ماشین، شبکه‌های عصبی و یادگیری عمیق می‌شود که هر کدام قابلیت‌های متمایزی را به این حوزه کلی ارائه می‌دهند. سیستم‌های هوش مصنوعی از کاربردهای متمرکز محدود که برای وظایف خاص طراحی شده‌اند تا سیستم‌های عمومی‌تر با قابلیت‌های گسترده‌تر را شامل می‌شوند. پیشرفت مداوم فناوری‌های هوش مصنوعی این سیستم‌ها را قادر ساخته است تا به مسائل به‌طور فزاینده پیچیده در حوزه‌های متنوع، از تشخیص‌های پزشکی گرفته تا پیش‌بینی‌های مالی، رسیدگی کنند.

یادگیری ماشین: زیرمجموعه‌ای از هوش مصنوعی

یادگیری ماشین (ML) به عنوان یک زیرمجموعه تخصصی در حوزه گسترده‌تر هوش مصنوعی وجود دارد. یادگیری ماشین نرم‌افزارها را قادر می‌سازد تا دقت پیش‌بینی خود را بدون برنامه‌نویسی صریح و با استفاده از داده‌های تاریخی برای پیش‌بینی مقادیر خروجی جدید، افزایش دهند. این قابلیت یک تغییر بنیادین نسبت به پارادایم‌های برنامه‌نویسی سنتی است که در آن تمام سناریوهای ممکن باید به‌صراحت کدنویسی شوند.

یادگیری ماشین از مدل‌های ریاضی استفاده می‌کند که به رایانه‌ها اجازه می‌دهد تا بر اساس تجربیات خود با داده‌ها، به طور مستقل یاد بگیرند و بهبود یابند. الگوریتم‌های کلاسیک یادگیری ماشین معمولاً برای انجام پیش‌بینی به داده‌های ساختاریافته و برچسب‌دار وابسته هستند و اغلب در طول توسعه و پیاده‌سازی خود به نظارت انسانی قابل توجهی نیاز دارند. فرآیند یادگیری شامل شناسایی الگوها در داده‌های آموزشی و استفاده از این الگوها برای پیش‌بینی یا تصمیم‌گیری در مورد داده‌های جدید و دیده‌نشده است.

رابطه بین هوش مصنوعی و یادگیری ماشین را می‌توان به صورت سلسله‌مراتبی درک کرد: در حالی که هوش مصنوعی مفهوم گسترده‌تر ایجاد هوش ماشینی را نشان می‌دهد، یادگیری ماشین یک روش‌شناسی خاص برای دستیابی به این هدف از طریق یادگیری داده‌محور ارائه می‌دهد. یادگیری ماشین به‌طور فزاینده‌ای در کاربردهای عملی هوش مصنوعی محوری شده است، زیرا رویکرد عملی‌تری نسبت به برنامه‌نویسی صریح تمام سناریوها و پاسخ‌های ممکن برای ایجاد رفتار هوشمند ارائه می‌دهد.

انواع رویکردهای یادگیری ماشین

یادگیری ماشین شامل چندین رویکرد متمایز است که هر کدام برای انواع مختلف مسائل و ساختارهای داده مناسب است:

یادگیری نظارت‌شده (Supervised learning): که در آن الگوریتم‌ها از داده‌های آموزشی برچسب‌دار برای انجام پیش‌بینی‌ها یاد می‌گیرند.
یادگیری بدون نظارت (Unsupervised learning): که الگوها را در داده‌های بدون برچسب شناسایی می‌کند.
یادگیری تقویتی (Reinforcement learning): که در آن الگوریتم‌ها اقدامات بهینه را از طریق آزمون و خطا یاد می‌گیرند.

هر یک از این رویکردها در حوزه‌های مختلف، از سیستم‌های توصیه‌گر گرفته تا وسایل نقلیه خودران، کاربرد یافته‌اند و تطبیق‌پذیری یادگیری ماشین را به عنوان جزئی از هوش مصنوعی نشان می‌دهند.

یادگیری عمیق: شبکه‌های عصبی و تشخیص الگوی پیشرفته

یادگیری عمیق (DL) نمایانگر تخصصی‌سازی بیشتری در حوزه یادگیری ماشین است که با استفاده از شبکه‌های عصبی مصنوعی با لایه‌های متعدد (از این رو «عمیق») متمایز می‌شود. برخلاف الگوریتم‌های سنتی یادگیری ماشین که ممکن است به داده‌های ساختاریافته و برچسب‌دار نیاز داشته باشند، سیستم‌های یادگیری عمیق عموماً می‌توانند از داده‌های خام و بدون برچسب مانند تصاویر و ویدئوها استفاده کنند تا به‌طور مستقل الگوها را شناسایی کرده و استنتاج‌های پیچیده‌ای انجام دهند.

قدرت یادگیری عمیق از معماری شبکه عصبی آن نشأت می‌گیرد که جنبه‌هایی از ساختار مغز انسان را تقلید می‌کند. این شبکه‌ها حاوی لایه‌های پنهان بین ورودی و خروجی هستند که الگوهای داده‌ای به‌طور فزاینده پیچیده را ثبت می‌کنند. پیکربندی و وزن‌دهی این لایه‌ها در توسعه مدل‌های مؤثر برای کاربردهای مختلف، از جمله تشخیص تصویر و گفتار، پردازش زبان طبیعی و سایر وظایف پیچیده، محوری است.

یادگیری عمیق در سال‌های اخیر قابلیت‌های هوش مصنوعی را متحول کرده و نتایج قابل توجهی در وظایفی که قبلاً برای رایانه‌ها چالش‌برانگیز تلقی می‌شدند، به دست آورده است. در برخی موارد، مدل‌های یادگیری عمیق از عملکرد انسانی فراتر رفته و به دقت پیشرفته (state-of-the-art) در حوزه‌های خاصی مانند طبقه‌بندی تصاویر و تشخیص گفتار دست یافته‌اند. این قابلیت پیشگامانه، پذیرش آن را در صنایع مختلف از تشخیص‌های پزشکی گرفته تا سیستم‌های رانندگی خودران تسریع کرده است.

رابطه بین یادگیری عمیق، یادگیری ماشین و هوش مصنوعی یک سلسله‌مراتب واضح را تشکیل می‌دهد: یادگیری عمیق زیرمجموعه‌ای تخصصی از یادگیری ماشین است که خود زیرمجموعه‌ای از حوزه گسترده‌تر هوش مصنوعی می‌باشد. هر سطح در این سلسله‌مراتب نشان‌دهنده سطح فزاینده‌ای از تخصص و پیچیدگی در رویکرد است.

هوش مصنوعی مولد (Generative Artificial Intelligence)

هوش مصنوعی مولد دسته‌ای از سیستم‌های هوش مصنوعی را نشان می‌دهد که به‌طور خاص برای ایجاد محتوای جدید طراحی شده‌اند، به‌جای اینکه صرفاً داده‌های موجود را تجزیه و تحلیل یا طبقه‌بندی کنند. این سیستم‌ها می‌توانند متن، تصویر، صدا یا رسانه‌های دیگری تولید کنند که شبیه محتوای تولید شده توسط انسان است.

توسعه هوش مصنوعی مولد در سال‌های اخیر تسریع شده است و سیستم‌ها در کاربردهای مختلفی به کار گرفته شده‌اند. به عنوان مثال، این فناوری‌ها در معماری‌های پیچیده در کنار بلاک‌چین، NFTها و یادگیری فدرال در محیط‌های متاورس ادغام شده‌اند. اتحادیه اروپا اهمیت متمایز فناوری‌های هوش مصنوعی مولد را تشخیص داده است، همانطور که در انتخاب‌های اصطلاح‌شناختی خاص در اسناد سیاستی مربوط به قانون هوش مصنوعی مشهود است که بین سیستم‌های هوش مصنوعی عمومی، مدل‌های پایه (foundation models) و هوش مصنوعی مولد تمایز قائل می‌شوند.

سیستم‌های هوش مصنوعی مولد اغلب بر رویکردهای یادگیری عمیق، به‌ویژه آن‌هایی که از معماری‌های ترانسفورمر استفاده می‌کنند و می‌توانند روابط متنی در داده‌ها را درک کنند، بنا شده‌اند. این سیستم‌ها معمولاً مجموعه داده‌های عظیمی را در طول آموزش پردازش می‌کنند تا الگوها و ساختارهایی را که بعداً برای تولید محتوا استفاده می‌کنند، بیاموزند. رابطه بین هوش مصنوعی مولد و چشم‌انداز گسترده‌تر هوش مصنوعی، رابطه‌ای از نوع تخصصی‌سازی است – این سیستم‌ها یک کاربرد خاص از فناوری‌های هوش مصنوعی را نشان می‌دهند که بر تولید محتوای خلاقانه متمرکز است.

مدل‌های زبانی بزرگ در اکوسیستم هوش مصنوعی

مدل‌های زبانی بزرگ (LLMs) یکی از مهم‌ترین پیشرفت‌های اخیر در حوزه هوش مصنوعی، به‌ویژه در قلمرو هوش مصنوعی مولد، را نشان می‌دهند. این مدل‌ها بر روی مجموعه‌های عظیمی از داده‌های متنی آموزش داده می‌شوند تا قابلیت‌هایی برای درک و تولید زبان انسانی توسعه دهند. مدل‌های زبانی بزرگ مانند Llama2-13B متا، هنگامی که به درستی کوانتیزه (quantized) و برای کاربردهای خاص تنظیم دقیق (fine-tuned) شوند، قابلیت‌های قابل توجهی را نشان داده‌اند.

علی‌رغم قابلیت‌های چشمگیر، مدل‌های زبانی بزرگ با چالش‌های قابل توجهی روبرو هستند. یک مسئله برجسته، “توهم” (hallucination) است که در آن این مدل‌ها محتوایی تولید می‌کنند که قابل قبول به نظر می‌رسد اما از نظر واقعی نادرست یا کاملاً ساختگی است. تحقیقات این توهمات را به دسته‌هایی مانند «سراب واقعی» (factual mirage) و «بارقه امید» (silver lining) با درجات شدت متفاوت از خفیف تا نگران‌کننده طبقه‌بندی کرده‌اند. این پدیده یکی از مبرم‌ترین نگرانی‌ها در به‌کارگیری LLMها برای کاربردهای حیاتی محسوب می‌شود.

رابطه بین مدل‌های زبانی بزرگ و طبقه‌بندی گسترده‌تر هوش مصنوعی چندوجهی است. LLMها نشان‌دهنده موارد زیر هستند:

یک کاربرد خاص از یادگیری عمیق، با استفاده از معماری‌های شبکه عصبی ترانسفورمر.
ابزاری قدرتمند در دسته هوش مصنوعی مولد، متمرکز بر تولید متن.
یک پیاده‌سازی عینی از اصول یادگیری ماشین در مقیاس بزرگ.
جزئی از چشم‌انداز گسترده‌تر هوش مصنوعی.

مدل‌های زبانی بزرگ قابلیت‌های پردازش زبان طبیعی را متحول کرده و کاربردهای جدیدی را در سراسر صنایع، از تولید محتوا تا اتوماسیون خدمات مشتری، امکان‌پذیر ساخته‌اند و یکی از مشهودترین مظاهر پیشرفت هوش مصنوعی در سال‌های اخیر به شمار می‌روند.

کاربردها در صنایع مختلف

ادغام هوش مصنوعی، یادگیری ماشین، یادگیری عمیق و کاربردهای تخصصی آن‌ها، صنایع متعددی را متحول کرده و ارزش عملی این فناوری‌ها را فراتر از پیشرفت‌های نظری نشان داده است.

کاربردهای حوزه سلامت

در حوزه سلامت، فناوری‌های هوش مصنوعی فرصت‌های جدیدی برای بهبود مراقبت از بیمار و تحقیقات پزشکی ایجاد کرده‌اند. سیستم‌های هوش مصنوعی می‌توانند در رسیدگی به مسائل مهم بهداشتی کمک کنند، اگرچه اثربخشی آن‌ها ممکن است به دلیل کیفیت داده‌های بهداشتی موجود و ناتوانی آن‌ها در بروز برخی ویژگی‌های انسانی مانند همدلی، محدود باشد. کاربردهای یادگیری ماشین در الکتروفیزیولوژی قلب توجه قابل توجهی را به خود جلب کرده است، به‌ویژه در تفسیر خودکار الکتروکاردیوگرام‌ها (ECG).

مدل‌های یادگیری عمیق پیشرفت‌های قابل توجهی در محیط‌های جراحی به دست آورده‌اند، به‌ویژه در پیش‌بینی پیچیدگی بازسازی دیواره شکم و سایر پیامدهای پس از عمل. این فناوری‌ها کاربردهایی از تحقیقات علوم پایه در مورد مکانیزم‌های آریتمی گرفته تا تکنیک‌های پیشرفته برای نقشه‌برداری عملکرد الکتریکی قلب و تحقیقات ترجمه‌ای مرتبط با مدیریت آریتمی را در بر می‌گیرند.

در داروسازی و توسعه دارو، روش‌های هوش مصنوعی و یادگیری ماشین انواع مختلف داده‌ها، از جمله ساختار شیمیایی دارو، اطلاعات دموگرافیک بیمار و اطلاعات ژنتیکی را تجزیه و تحلیل می‌کنند. این فناوری‌ها به‌طور مؤثری برای توسعه دارو و شناسایی اهداف دارویی مورد استفاده قرار گرفته‌اند و اخیراً مدل‌های هوش مصنوعی ظهور کرده‌اند که می‌توانند جمعیت بیماران را مشخص کرده و پاسخ‌های درمانی فردی را پیش‌بینی کنند.

کاربردهای سایر بخش‌ها

فراتر از حوزه سلامت، فناوری‌های هوش مصنوعی با افزایش کارایی، دقت و ارزش اقتصادی، در حال تغییر شکل صنایع متعددی هستند. در تحلیل کسب‌وکار، سازمان‌ها از قدرت داده‌ها از طریق هوش مصنوعی برای به دست آوردن بینش‌هایی استفاده می‌کنند که منجر به استراتژی‌های بهبود یافته، عملیات پیشرفته‌تر و در نهایت سودآوری قوی‌تر می‌شود. یادگیری ماشین و تحلیل داده‌ها به خودکارسازی فرآیندها، کاهش هزینه‌ها و بهبود کیفیت تصمیمات اتخاذ شده در زمینه‌های کسب‌وکار کمک می‌کنند.

بخش دولتی نیز پتانسیل کاربردهای هوش مصنوعی را تشخیص داده است، اگرچه استقرار آن چالش‌های منحصر به فردی را در زمینه‌های دولتی ایجاد می‌کند. یک چارچوب طبقه‌بندی برای کاربردهای هوش مصنوعی به منظور تسهیل استقرار در بخش دولتی توسعه یافته است که به نقش دولت به عنوان کاربر فناوری‌های هوش مصنوعی می‌پردازد.

نتیجه‌گیری

هوش مصنوعی حوزه گسترده‌ای از علوم کامپیوتر است که بر ایجاد سیستم‌هایی تمرکز دارد که قادر به انجام وظایفی هستند که معمولاً به هوش انسانی نیاز دارند. در این حوزه، یک رابطه سلسله‌مراتبی واضح بین فناوری‌های مختلف وجود دارد. یادگیری ماشین پایه و اساس روش‌شناختی را برای سیستم‌ها فراهم می‌کند تا از داده‌ها بدون برنامه‌نویسی صریح یاد بگیرند. یادگیری عمیق، زیرمجموعه‌ای از یادگیری ماشین، از شبکه‌های عصبی با لایه‌های متعدد برای پردازش الگوهای پیچیده در داده‌ها استفاده می‌کند. هوش مصنوعی مولد در ایجاد محتوا به جای تحلیل تخصص دارد، در حالی که مدل‌های زبانی بزرگ یک پیاده‌سازی خاص از اصول یادگیری عمیق برای پردازش و تولید زبان طبیعی را نشان می‌دهند.

درک این روابط، اکوسیستم هوش مصنوعی را روشن می‌کند و نشان می‌دهد که چگونه هر فناوری بر قابلیت‌های پیشینیان خود بنا شده و آن‌ها را گسترش می‌دهد. با ادامه تکامل این فناوری‌ها، احتمالاً ادغام آن‌ها در سراسر صنایع تسریع خواهد شد و هم فرصت‌های جدید و هم چالش‌هایی را ارائه خواهد داد. در حالی که قابلیت‌های فنی به سرعت پیشرفت می‌کنند، ملاحظات اخلاقی در مورد حریم خصوصی، سوگیری، جایگزینی شغلی و تعامل انسان و هوش مصنوعی همچنان حوزه‌های حیاتی هستند که نیازمند توجه مداوم می‌باشند.

توسعه مداوم هوش مصنوعی و فناوری‌های مرتبط با آن احتمالاً جنبه‌های متعددی از جامعه را تغییر شکل خواهد داد و نیازمند رویکردهای سنجیده برای به حداکثر رساندن منافع و در عین حال رسیدگی به خطرات بالقوه در این حوزه به سرعت در حال تحول است.

نویسنده:‌ دکتر جواد خنیفر

«استفاده از این مقاله بدون اجازه از نویسنده امکان‌پذیر نیست.»

AI (Artificial Intelligence)
ML (Machine Learning)
DL (Deep Learning)
LLMs (Large Language Models)