مائیکروسافٹ نے اعلان کیا ہے کہ اس کی اسپیچ ریکگنیشن ٹیکنالوجی اس کی غلطی کی شرح کو کم کرتی ہے اور انسانوں کی طرح موثر ہے
یہ ان ستونوں میں سے ایک ہے جس پر بہت سے لوگ اس بات کی تصدیق کرتے ہیں کہ مستقبل قریب میں مختلف پلیٹ فارمز بڑھیں گے۔ تحریری احکامات یا اشاروں کے ساتھ تعامل کرنے کے لیے کچھ بھی نہیں۔ مستقبل مشینوں سے بات کرنے میں مضمر ہے لیکن روبوٹک کمانڈز اور غیر فطری احکامات کے ساتھ بات نہیں کرنا۔ ہم اسے فطری زبان کے ساتھ کریں گے، جس کی ہم ذاتی معاونین میں زیادہ سے زیادہ واضح طور پر تعریف کرتے ہیں۔"
اور ان فرموں میں سے ایک جن کا اس لحاظ سے سب سے زیادہ قابل ذکر کیریئر ہے Microsoft ہے، ایک ایسی کمپنی جس کے پاس ترقی کا راستہ ہے جس میں وہ اپنے پلیٹ فارمز پر ملازمین کی آواز کی شناخت کو مسلسل بہتر بنانے کے لیے کام کرتی ہے۔ایک ایسی ٹیکنالوجی جس کے بارے میں اب ہمارے پاس ڈیولپمنٹ ٹیم کی طرف سے خبریں ہیں، خبریں جو کے بارے میں بات کرتی ہیں ایک بہت بڑی بہتری جو اسے درستگی کی اسی سطح پر رکھتی ہے جو انسانوں میں استعمال ہوتی ہے
اس لحاظ سے انہوں نے اعلان کیا ہے کہ WER میں ان کا آواز کی شناخت کا نظام 5.1% تک پہنچ گیا ہے، یعنی شرح میں خرابی استعمال شدہ لفظ کا۔ بہت سے لوگوں کے لیے یہ کچھ نہیں کہہ سکتا، لیکن حیرت ہوتی ہے اگر ہم دیکھیں کہ کس طرح ایک طرف یہ شرح وہی ہے جو ہم لوگوں کے درمیان رابطے میں دیکھتے ہیں
ایسا کرنے کے لیے، ریڈمنڈ سے انہوں نے عصبی نیٹ ورکس کے استعمال پر مبنی زبانی اور صوتی زبان کے بہتر ماڈلز کا استعمال کرنے کا انتخاب کیا ہےیہ ہیں ان کو طویل مدتی دو طرفہ میموری کے ساتھ جوڑا گیا ہے تاکہ صوتی ماڈلنگ کو بہتر بنایا جائے، اس طرح ان الفاظ کی پیشین گوئی کی بدولت شناخت میں بہتری آتی ہے جو مواصلات کی تاریخ کی بنیاد پر استعمال کیے جا سکتے ہیں۔ان بہتریوں کو کلاؤڈ کی حمایت بھی حاصل ہے اس کوشش کی بدولت جو کمپنی نے کلاؤڈ کمپیوٹنگ کے بنیادی ڈھانچے کو بہتر بنانے کے لیے کی ہے، خاص طور پر Azure کے ساتھ۔
اس کے علاوہ، اس کا مطلب یہ ہے کہ خرابی کی اس شرح کو ناکامی کے مارجن کے لحاظ سے کم کر دیا گیا ہے، کیونکہ اس سے پہلے 5.9%، اس طرح 12% سے گر گیا، جو کہ ایک سال پہلے کے نظام کے پاس موجود اعداد و شمار تھا۔ لہذا، مائیکروسافٹ نے تقریر کی شناخت کے نظام کو انسانوں کی طرح مؤثر طریقے سے حاصل کیا ہے اور وہ جس ترقی کو لے رہے ہیں، یہ حیرت کی بات نہیں ہے کہ وہ آنے والے مہینوں یا سالوں میں اس میں بہتری بھی لائیں گے۔
کون جانتا ہے کہ اب سے چند سالوں میں ہمارے ونڈوز پی سی سے بات کرنا، کورٹانا کے ساتھ بات چیت کرنا، یا آفس جیسی ایپلی کیشنز، اتنا ہی فطری ہوگا جتنا کہ انہوں نے ہمیں پہلے ہی خواب بنا رکھا ہے (یا ڈراؤنے خواب، کون جانتا ہے) سنیما میں۔
Xataka میں | یہ قبر کے پار سے آنے والی آوازیں نہیں ہیں، یہ چھپے ہوئے حکم ہیں جنہیں آواز کے معاون پہچانتے ہیں اور انسان نہیں پہچانتے