आज की तेजी से बदलती AI दुनिया में एक नया नाम सुर्खियों में है – मिथिल वकड़े (Mithil Vakde)। यह 24 साल के युवा रिसर्चर बेंगलुरु (बंगलौर) से हैं, जिन्होंने एक छोटे से ट्रांसफॉर्मर मॉडल को ट्रेन करके OpenAI, Anthropic और xAI जैसे बड़े कंपनियों के मॉडल्स को एक मुश्किल बेंचमार्क पर पीछे छोड़ दिया है। सबसे हैरान करने वाली बात यह है कि उनका पूरा काम सिर्फ 67 सेंट (लगभग 61 रुपये) में पूरा हो गया। यह खबर AI कम्युनिटी में तहलका मचा रही है, क्योंकि यह दिखाता है कि बड़े-बड़े संसाधनों के बिना भी असाधारण काम किया जा सकता है।

ARC-AGI बेंचमार्क क्या है और क्यों इतना खास है?
ARC-AGI का पूरा नाम Abstract and Reasoning Corpus for Artificial General Intelligence है। यह फ्रांसिस्को चोलेट ने बनाया था। यह बेंचमार्क AI की असली रीजनिंग (तर्क करने की क्षमता) को परखता है, न कि सिर्फ डेटा याद करने की।
इसमें AI को रंगीन ग्रिड (जाली) वाली विजुअल पजल्स दी जाती हैं। कुछ उदाहरणों से AI को नियम समझना होता है और फिर नई ग्रिड पर उसे लागू करके आउटपुट बनाना होता है। ये पजल्स बहुत मुश्किल होती हैं क्योंकि:
- कोई पहले से ट्रेनिंग डेटा नहीं होता।
- मेमोराइजेशन काम नहीं आता।
- असली समझ और फ्लेक्सिबल थिंकिंग चाहिए।
ARC-AGI को AGI (आर्टिफिशियल जनरल इंटेलिजेंस) की दिशा में एक बड़ा टेस्ट माना जाता है। बड़े-बड़े LLM जैसे GPT-4, Claude या Grok भी इसमें पहले बहुत कम स्कोर करते थे (कई बार 20-30% के आसपास)। लेकिन अब मिथिल का मॉडल ARC-AGI-1 के पब्लिक इवैल्यूएशन सेट पर 44% स्कोर कर चुका है। यानी 400 टास्क में से 176 सॉल्व किए।
यह स्कोर OpenAI के GPT-5 (low) के बराबर है, लेकिन लागत में बहुत बड़ा फर्क है।
Mithil के मॉडल की कमाल की किफायत
मिथिल ने एक छोटा ट्रांसफॉर्मर मॉडल स्क्रैच से ट्रेन किया। इसे सिर्फ 1.5 से 2 घंटे लगे एक RTX 5090 GPU पर। कुल खर्च – ट्रेनिंग + इंफरेंस (400 टास्क चलाने) – सिर्फ 0.67 डॉलर (67 सेंट, यानी करीब 61 रुपये)।
तुलना देखिए:
- OpenAI का GPT-5 low भी 44% स्कोर करता है, लेकिन एक टास्क पर करीब 15 सेंट खर्च।
- 400 टास्क के लिए अनुमानित खर्च: लगभग 15 डॉलर (करीब 1400 रुपये) या उससे ज्यादा।
- यानी मिथिल का मॉडल 22 गुना सस्ता है!
यह नया Pareto frontier बनाता है – यानी परफॉर्मेंस और कॉस्ट के बीच का सबसे अच्छा बैलेंस। मिथिल का ब्लॉग पोस्ट कहता है कि उनका मॉडल कई LLM से बेहतर है और ट्रेनिंग कॉस्ट में 333 गुना सस्ता है कुछ अन्य स्पेशलाइज्ड मॉडल्स से।
यह दिखाता है कि स्केल (बड़े मॉडल) के अलावा स्मार्ट आर्किटेक्चर, मेटा-लर्निंग और सैंपल एफिशिएंसी पर फोकस करके भी बड़ी सफलता मिल सकती है।

Mithil Vakde कौन हैं?
मिथिल वकड़े IIT बॉम्बे से इंजीनियरिंग फिजिक्स में ग्रेजुएट हैं (2023 बैच)। वे बेंगलुरु के इंडिरानगर से हैं और इंडिपेंडेंट AI रिसर्चर हैं। उनका X (ट्विटर) हैंडल @evilmathkid है। उन्होंने अपना काम पूरी तरह ओपन-सोर्स किया है, ताकि कोई भी डेवलपर इसे यूज कर सके, इम्प्रूव कर सके।
यह उपलब्धि इसलिए भी खास है क्योंकि यह एक अकेले रिसर्चर की है – कोई बड़ी कंपनी, कोई करोड़ों का फंडिंग नहीं। यह भारतीय टैलेंट की ताकत दिखाता है।
AI दुनिया में इसका क्या मतलब है?
- कॉस्ट-एफिशिएंसी का नया दौर: बड़े AI मॉडल चलाने के लिए अरबों डॉलर खर्च होते हैं। लेकिन मिथिल का काम बताता है कि स्मार्ट तरीके से छोटे मॉडल भी बहुत कुछ कर सकते हैं। यह छोटे स्टार्टअप्स और इंडिविजुअल रिसर्चर्स के लिए बड़ा मौका है।
- रीजनिंग पर फोकस: LLM ज्यादातर पैटर्न मैचिंग करते हैं। ARC जैसे बेंचमार्क असली रीजनिंग मांगते हैं। मिथिल का ट्रांसफॉर्मर-बेस्ड मेटा-लर्निंग अप्रोच इस दिशा में एक कदम है।
- भारत की AI पावर: भारत में AI टैलेंट बहुत है। ऐसे युवा रिसर्चर्स दुनिया को चुनौती दे रहे हैं। यह इंस्पायरिंग है – अगर एक व्यक्ति 61 रुपये में इतना कर सकता है, तो सोचिए अगर ज्यादा सपोर्ट मिले तो क्या होगा!
- ओपन-सोर्स का महत्व: मिथिल ने अपना कोड और डिटेल्स शेयर किए। इससे कम्युनिटी आगे बढ़ सकती है। ARC Prize जैसी कॉम्पिटिशन में ऐसे काम महत्वपूर्ण हैं।
भविष्य में क्या हो सकता है?
अगर मिथिल का मॉडल ऑफिशियल लीडरबोर्ड पर जगह बनाए, तो यह सबसे सस्ता 44% स्कोर वाला मॉडल होगा। ARC-AGI-2 पर भी उनका मॉडल 7% स्कोर कर रहा है, जो शुरुआत के लिए अच्छा है।
यह दिखाता है कि AI में अभी बहुत स्कोप है इनोवेशन का। स्केल के अलावा आइडिया, एफिशिएंसी और क्रिएटिविटी मायने रखती है।
निष्कर्ष
मिथिल वकड़े की यह उपलब्धि सिर्फ एक स्कोर नहीं है – यह एक मैसेज है। कि मेहनत, स्मार्ट थिंकिंग और थोड़े से संसाधनों से भी दुनिया की बड़ी कंपनियों को टक्कर दी जा सकती है। भारतीय युवा AI में आगे बढ़ रहे हैं और ऐसा काम करके प्रूव कर रहे हैं।
अगर आप AI में इंटरेस्टेड हैं, तो मिथिल के GitHub या ब्लॉग पर जाकर उनके काम को देखें। शायद आप भी कुछ नया क्रिएट कर सकें!
अधिक रोचक AI अपडेट्स का इंतज़ार न करें – अभी पढ़ें
Anthropic ने OpenAI को पीछे छोड़ा –73% Enterprise Spend अब Anthropic के पास, OpenAI घटकर 26.7% पर
Programmers के लिए बड़ी खबर: OpenAI Codex Security AI अब खुद ठीक करेगा आपके Code के Bugs










