नई दिल्ली। ओपनएआई ने हाल ही में अपने जीपीटी-5 एआई मॉडल का परीक्षण करने वाला नया बेंचमार्क GDPval पेश किया है। यह टेस्ट यह जांचता है कि एआई मॉडल विभिन्न उद्योगों और नौकरियों में पेशेवर मानवों के मुकाबले कितना बेहतर या समान प्रदर्शन कर सकता है। GDPval का उद्देश्य यह समझना है कि ओपनएआई के सिस्टम आर्थिक रूप से महत्वपूर्ण कामों में मानव विशेषज्ञों के स्तर तक पहुँच चुके हैं या नहीं।
ओपनएआई का क्या कहना है ?
ओपनएआई के अनुसार, जीपीटी-5 और एंथ्रोपिक का क्लाउड ओपस 4.1 मॉडल अब उद्योग विशेषज्ञों द्वारा किए जाने वाले काम के करीब हैं। जीपीटी-5-हाई संस्करण 44 नौकरियों में 40.6% कार्यों में विशेषज्ञों के बराबर या उनसे बेहतर पाया गया। क्लाउड ओपस 4.1 लगभग 49% कार्यों में मानव विशेषज्ञों के बराबर था।
बेंचमार्क मॉडल GDPval का दायरा
GDPval अमेरिका के उन नौ प्रमुख उद्योगों में एआई मॉडल का परीक्षण करता है, जो देश के कुल जीडीपी में सबसे ज्यादा योगदान देते हैं। इनमें हेल्थकेयर, वित्त, मैन्युफैक्चरिंग और सरकारी सेवाएँ शामिल हैं। बेंचमार्क में सॉफ्टवेयर इंजीनियर्स, नर्सेज, पत्रकार और अन्य पेशेवरों के कार्यों की तुलना एआई द्वारा किए गए काम से की जाती है। ओपनएआई ने इस बेंचमार्क में पेशेवरों से एआई-जनित रिपोर्ट की तुलना मानव-जनित रिपोर्ट से करने को कहा। एआई के प्रदर्शन का औसत निकालकर यह पता लगाया गया कि वह कितनी बार इंसानों के बराबर या उनसे बेहतर है।
इस टेस्ट के क्या महत्व हैं?
हालांकि जीपीटी-5 का प्रदर्शन प्रभावशाली है, लेकिन यह टेस्ट केवल कुछ विशेष कार्यों का मूल्यांकन करता है। वास्तविक पेशेवर कार्यों में रिपोर्टिंग के अलावा कई और जटिलताएँ होती हैं। ओपनएआई ने कहा है कि भविष्य में वह अधिक उद्योगों और इंटरैक्टिव वर्कफ्लो को शामिल कर परीक्षण को और विस्तारित करेंगे।
एक्सपर्ट का क्या कहना है ?
ओपनएआई के मुख्य अर्थशास्त्री डॉ. आरोन चटर्जी का कहना है कि एआई मॉडल के इस स्तर पर पहुंचने से पेशेवर अपने समय को अधिक महत्वपूर्ण कार्यों पर केंद्रित कर सकते हैं और कुछ कार्य एआई को सौंप सकते हैं। जीपीटी-4o मॉडल 15 महीने पहले केवल 13.7% मामलों में मानव विशेषज्ञों के बराबर था, जबकि जीपीटी-5 ने यह आंकड़ा लगभग तीन गुना बढ़ा दिया है। यह एआई की तेजी से हो रही प्रगति का संकेत है।
निष्कर्ष
GDPval जैसे बेंचमार्क एआई मॉडल की वास्तविक दुनिया की नौकरियों में दक्षता को मापने का एक महत्वपूर्ण तरीका बन सकते हैं। हालांकि, यह निश्चित रूप से कहने के लिए कि एआई मानवों से बेहतर प्रदर्शन कर सकता है, ओपनएआई को और व्यापक परीक्षण करने की आवश्यकता होगी।