🔓 این روزها خیلی از LLMها رو با عنوان «Open Source» معرفی میکنن، اما شاید بهتر باشه کمی دقیقتر بهش نگاه کنیم.
هر مدلی که بشه دانلودش کرد، لزوماً متنباز نیست. بین اینها فرق وجود داره:
🧠 مدل Open-weight: یعنی وزنهای مدل منتشر شده و میتونید مدل رو دانلود و اجرا کنید.
🧩 مدل Open-source: یعنی علاوه بر خروجی نهایی، وزنها، اطلاعات کافی درباره کد، داده، روش آموزش، تنظیمات و لایسنس هم در دسترسه.
📦 به زبان سادهتر، اگر فقط فایل مدل رو به شما بدن، میتونید ازش استفاده کنید.
🔍 اما اگر مسیر ساخت مدل هم شفاف باشه، میتونید بفهمید چطور ساخته شده، چه محدودیتهایی داره، چطور میشه تغییرش داد و چقدر میشه بهش اعتماد کرد.
⚠️ این تفاوت کوچیکی نیست
توی نرمافزار، وقتی سورسکد بازه، فقط «برنامه قابل اجرا» نداریم؛ منطق پشت برنامه رو هم میبینیم.
🤖 توی LLM هم اگر فقط وزنها رو داشته باشیم، بیشتر شبیه اینه که باینری یک برنامه رو گرفته باشیم، نه الزاماً سورس کاملش رو.
الان معمولاً به همه اینها میگیم Open Source، اما فکر میکنم در آینده فرقشون رو خیلی بیشتر متوجه میشم.
چون این کلمات فقط بحث لغوی نیستن؛ روی اعتماد، امنیت، قابلیت بازبینی و حتی آینده رقابت توی این حوزه هم اثر میذارن.
🔗 چند لینک برای مطالعه بیشتر:
-
Open Source Initiative — The Open Source AI Definition https://opensource.org/ai/open-source-ai-definition
-
Hugging Face — Model Cards https://huggingface.co/docs/hub/en/model-cards
-
Hugging Face — Models Hub https://huggingface.co/models
-
Meta — Llama 3.1 Community License https://www.llama.com/llama3_1/license/
-
Mistral AI — Models https://mistral.ai/models