مهندسی پرامپت (Prompt Engineering)

مهندسی پرامپت (Prompt Engineering) چیست؟ راهنمای کامل تکنیک‌ها و ابزارها مهندسی پرامپت (Prompt Engineering) یکی از کلیدی‌ترین مهارت‌ها در کار با مدل‌های زبانی بزرگ (LLMها) مانند ChatGPT است. در این حوزه، ما یاد می‌گیریم چطور با طراحی و بهینه‌سازی پرسش‌ها و دستورات (پرامپت‌ها)، مدل را به سمت تولید پاسخ‌های دقیق‌تر، کاربردی‌تر و مرتبط‌تر هدایت کنیم. […]

مدل‌های زبان بزرگ (LLM)

مدل زبان بزرگ چیست؟ مدل‌های زبان بزرگ یا Large Language Models که به اختصار LLMs نیز می‌گویند نوعی مدل یادگیری ماشین هستند که برای درک، تولید و تعامل با زبان انسانی طراحی شده‌اند. این مدل‌ها با استفاده از معماری قدرتمند ترنسفورمر (Transformer) آموزش می‌بینند و توانایی دارند زبان را با دقتی بی‌نظیر تحلیل کنند. آن‌ها […]

پیش‌بینی در الگوریتم‌های یادگیری ماشین

امروزه الگوریتم‌های یادگیری ماشین و به خصوص یادگیری عمیق را در خیلی از حوزه‌ها مانند سلامت و پزشکی، صنعت و تولید و همچنین مالی  مورد استفاده قرار می‌گیرد به زبان دیگر می‌شود گفت که مردم به شدت مشتاق هستند که از قدرت هوش مصنوعی در جنبه‌های کلیدی زندگی خود استفاده کنند. اما استفاده از هوش […]

پس انتشار خطا

backpropagation

یکی از مهم‌ترین قسمت‌های الگوریتم‌های شبکه عصبی که امروزه بسیار کاربرد دارد، پس انتشار خطا یا Backpropagation است که به مدل‌ها این امکان را می‌دهد که از روی داده‌های آموزش یادبگیرد و در طول زمان مدل را بهبود دهد.  این که به درستی پس‌انتشار خطا را بشناسید و نحوه کارکرد آن را بدانید برای ورود […]

بهینه ساز (optimizer)

بهینه ساز (optimizer)

یکی از مهم‌ترین تکنیک‌های که در یادگیری ماشین وجود دارد Optimizer ها هستند و نقش مهمی در حل مسائل پیچیده در زمینه‌های مختلف را ایفا می‌کنند، به خصوص در یادگیری عمیق. وظیفه اصلی این تکنیک کاهش تابع هزینه (Loss function) در طی فرآیند آموزش است. در این مقاله ما سعی می‌کنیم به طور کلی تعریف […]

شبکه عصبی کانولوشنی

در مقاله قبل (این مقاله را می‌توانید در این لینک بخوانید) ساختار اصلی یک شبکه چندلایه پرسپترون را بررسی کردیم. حال در این مقاله به آموزش یک شبکه ساده کانولوشنی و نحوه کد نویسی آن در کتابخانه keras می‌پردازیم. شبکه عصبی کانولوشنی چیست؟ شبکه عصبی کانولوشنی (Convolutional Neural Network) یا به اختصار CNN یک الگوریتم […]

توابع فعال سازی

توابع فعال سازی (Activation function)

همانطور که در مقاله شبکه‌های عصبی پرسپترون چند لایه (می‌توانید مقاله را در این لینک بخوانید) بیان شد هر نورون دارای یک تابع فعال سازی است که باعث می‌شود که نورون‌ها توانایی استخراج الگوهای پیچیده‌تر را داشته باشند و سیگنال ورودی را بعد از پردازش به لایه بعدی انتقال می‌دهد. بدون استفاده از توابع فعال […]