مهندسی پرامپت (Prompt Engineering)

مهندسی پرامپت (Prompt Engineering) چیست؟ راهنمای کامل تکنیکها و ابزارها مهندسی پرامپت (Prompt Engineering) یکی از کلیدیترین مهارتها در کار با مدلهای زبانی بزرگ (LLMها) مانند ChatGPT است. در این حوزه، ما یاد میگیریم چطور با طراحی و بهینهسازی پرسشها و دستورات (پرامپتها)، مدل را به سمت تولید پاسخهای دقیقتر، کاربردیتر و مرتبطتر هدایت کنیم. […]
مدلهای زبان بزرگ (LLM)

مدل زبان بزرگ چیست؟ مدلهای زبان بزرگ یا Large Language Models که به اختصار LLMs نیز میگویند نوعی مدل یادگیری ماشین هستند که برای درک، تولید و تعامل با زبان انسانی طراحی شدهاند. این مدلها با استفاده از معماری قدرتمند ترنسفورمر (Transformer) آموزش میبینند و توانایی دارند زبان را با دقتی بینظیر تحلیل کنند. آنها […]
پیشبینی در الگوریتمهای یادگیری ماشین

امروزه الگوریتمهای یادگیری ماشین و به خصوص یادگیری عمیق را در خیلی از حوزهها مانند سلامت و پزشکی، صنعت و تولید و همچنین مالی مورد استفاده قرار میگیرد به زبان دیگر میشود گفت که مردم به شدت مشتاق هستند که از قدرت هوش مصنوعی در جنبههای کلیدی زندگی خود استفاده کنند. اما استفاده از هوش […]
پس انتشار خطا

یکی از مهمترین قسمتهای الگوریتمهای شبکه عصبی که امروزه بسیار کاربرد دارد، پس انتشار خطا یا Backpropagation است که به مدلها این امکان را میدهد که از روی دادههای آموزش یادبگیرد و در طول زمان مدل را بهبود دهد. این که به درستی پسانتشار خطا را بشناسید و نحوه کارکرد آن را بدانید برای ورود […]
بهینه ساز (optimizer)

یکی از مهمترین تکنیکهای که در یادگیری ماشین وجود دارد Optimizer ها هستند و نقش مهمی در حل مسائل پیچیده در زمینههای مختلف را ایفا میکنند، به خصوص در یادگیری عمیق. وظیفه اصلی این تکنیک کاهش تابع هزینه (Loss function) در طی فرآیند آموزش است. در این مقاله ما سعی میکنیم به طور کلی تعریف […]
شبکه عصبی کانولوشنی

در مقاله قبل (این مقاله را میتوانید در این لینک بخوانید) ساختار اصلی یک شبکه چندلایه پرسپترون را بررسی کردیم. حال در این مقاله به آموزش یک شبکه ساده کانولوشنی و نحوه کد نویسی آن در کتابخانه keras میپردازیم. شبکه عصبی کانولوشنی چیست؟ شبکه عصبی کانولوشنی (Convolutional Neural Network) یا به اختصار CNN یک الگوریتم […]
توابع فعال سازی

همانطور که در مقاله شبکههای عصبی پرسپترون چند لایه (میتوانید مقاله را در این لینک بخوانید) بیان شد هر نورون دارای یک تابع فعال سازی است که باعث میشود که نورونها توانایی استخراج الگوهای پیچیدهتر را داشته باشند و سیگنال ورودی را بعد از پردازش به لایه بعدی انتقال میدهد. بدون استفاده از توابع فعال […]