गूगल ने जेमिनी एआई मॉडल के लाइव API में ऑडियो मॉडल किया शामिल , जानें डिटेल्स

आप सभी गूगल gemini का इस्तेमाल तो करते ही होंगे लेकिन क्या आप यह जानते कि अभी हाल ही में उसमें एक अपडेट आया है जिसके वजह से अब आप बोलकर भी आसानी से बातचीत कर सकते हैं।

Vandana Rajput

Sep 27, 2025 - 21:49

Google Gemini Official Website

गूगल ने जेमिनी एआई मॉडल के लाइव API में ऑडियो मॉडल किया शामिल , जानें डिटेल्स

गूगल ने हाल ही में अपने जेमिनी एआई मॉडल के लाइव एपीआई में एक शानदार अपडेट दिया है जिसमें ऑडियो मॉडल को शामिल किया गया है। अब आप इसमें पहले से भी बेहतर तरीके से बातचीत कर पाएंगे और आपका काम पहले से भी ज्यादा आसान हो जाएगा इसके बारे में डिटेल्स में हम आपको इस आर्टिकल में बताते हैं।

ऑडियो मॉडल में क्या है खास

यह ऑडियो मॉडल जेमिनी 2.5 फ्लैश पर आधारित है जो लाइव एपीआई के जरिए नैचुरल साउंडिंग वॉइस जेनरेट करता है। यह मॉडल 30 से ज्यादा हाई-डेफिनिशन वॉइस ऑप्शंस और 24 से अधिक भाषाओं का सपोर्ट करता है। यह पुराने टेक्स्ट-टू-स्पीच सिस्टम्स से अलग है और यह सीधे ऑडियो आउटपुट पैदा करता है।

लाइव एपीआई का मज़ा

जेमिनी लाइव एपीआई पहले से ही रीयल-टाइम वॉइस और वीडियो इंटरैक्शंस को सपोर्ट करता था लेकिन इस नए मॉडल के साथ यह और स्ट्रांग हो गया है। यह अपडेट प्रीव्यू मोड में उपलब्ध है जो डेवलपर्स को टेस्ट करने का मौका देता है। गूगल का कहना है कि यह बदलाव वॉइस एजेंट्स को और बेहतरीन बनाता है।

The News Tv India Official

पहले से ज्यादा लगेगा नेचुरल

अब जेमिनी मॉडल बातचीतों को और ज्यादा नेचुरल बना सकता है। यह इंटरप्शंस, पॉज और साइड कन्वर्सेशंस को बेहतर तरीके से हैंडल करता है। इससे उपयोगकर्ता को लगता है जैसे वे किसी दोस्त से बात कर रहे हों। इससे यूजर जल्दी बोर भी नहीं होता है और उसे बात करने में मजा भी आता है।

अफेक्टिव डायलॉग फीचर

इस मॉडल की सबसे रोचक फीचर है अफेक्टिव डायलॉग जो यूजर की भावनाओं को पहचानकर रिएक्शन देता है। अगर आप गुस्से में बोलें या खुशी से तो जेमिनी उसी के अनुसार टोन एडजस्ट कर लेगा। यह फीचर नैचुरल कन्वर्सेशंस को गहराई देता है जैसे कि मॉडल वाकई में आपकी फीलिंग्स को समझ रहा हो।

The News Tv India Official

प्रोएक्टिव ऑडियो फीचर

प्रोएक्टिव ऑडियो फीचर मॉडल को बैकग्राउंड नॉइज या इररेलेवेंट बातों को इग्नोर करने की कैपेसिटी देता है। यह केवल तभी रिस्पॉन्ड करता है जब बातचीत सीधे जुड़ी हो। इससे फालतू के इंटरप्शंस रुक जाते हैं और कन्वर्सेशन ज्यादा फोकस्ड रहती है। अगर आप शोरगुल वाले माहौल में है तो भी आपको बहुत ही बेहतर रिस्पॉन्स मिलेगा।

मिलेगा मल्टीलिंगुअल सपोर्ट

नया मॉडल 24 से ज्यादा भाषाओं में सीधे काम करता है। आप हिंदी में शुरू करें और अचानक इंग्लिश स्विच कर दें जेमिनी बिना रुके फॉलो कर लेगा। यह फीचर ग्लोबल ऐप्स के लिए बढ़िया है जहां यूजर्स अलग-अलग भाषाओं में बात करते हैं। ट्रांसक्रिप्शन की एक्यूरेसी भी बेहतर हो गई है जिससे गलतियां कम होती हैं।

The News Tv India Official

लाइव डाटा मिलेगा अब आसान से

इस अपडेट के साथ फंक्शन कॉलिंग को और मजबूत किया गया है जो मॉडल को रीयल-टाइम डेटा सोर्सेस जैसे गूगल सर्च से जोड़ता है। डेवलपर्स अब कस्टम टूल्स इंटीग्रेट कर सकते हैं जिससे कन्वर्सेशंस ज्यादा प्रैक्टिकल बन जाती हैं।

लायेगा कई एप्लीकेशंस में बदलाव

यह मॉडल वर्चुअल असिस्टेंट्स, एजुकेशनल टूल्स और कस्टमर सर्विस बॉट्स के लिए गेम-चेंजर साबित हो सकता है। यह कई फील्ड के लिए बहुत ही ज्यादा फायदेमंद साबित होगा। फिर चाहे वह हेल्थ केयर का फील्ड हो या फिर किसी भी स्टूडेंट के पढ़ाई का फील्ड हो।

Tags:

Vandana Rajput My name is Vandana Raghav. I live in Jodhpur. I have done B.Sc. , B.ed and M.Sc. I like to give information related to tech , education , finance , Gaming and many fields . I have more than 5 years experience in this field.