بحث کاربر:Aso

از ویکی‌پدیا، دانشنامهٔ آزاد.

[ویرایش] خوش آمدید

خوش آمدید
سلام Aso، و به ویکی‌پدیا خوش آمدید! از مشارکت شما سپاسگزارم. امیدوارم که از اینجا خوشتان بیاید و تصمیم به ماندن بگیرید. پیوندهای زیر برای کاربرهای جدید مفیدند:

امیدوارم از ویکی‌پدیانویس بودن لذت ببرید! لطفاً برای آزمایش از ویکی‌پدیا:گودال ماسه‌بازی استفاده کنید و در صفحات بحث نام خود را با چهار علامت مدک امضا کنید، (~~~~)، با این کار نام شما و تاریخ به عنوان امضا درج خواهد شد. در صورتی که سوال داشتید، به صفحهٔ قهوه‌خانه بروید، یا اینکه از من در صفحهٔ بحثم بپرسید. باز هم خوش آمد می‌گویم!
بد نیست این مقاله را به ورودی مناسبی مثل تشخیص گفتار منتقل کنید. مهدی ب ۲۳ اردیبهشت ۱۳۸۵ (۱۳-۰۵-۲۰۰۶)، ۱۷:۰۱


[ویرایش] تشخيص خودکار گفتار فارسي

برقراري ارتباط گفتاري با كامپيوترها به جاي استفاده از صفحه كليد و ماوس يكي از زمينه‌هاي تحقيقاتي مهم چند دهه‌ي اخير بوده است و شركت‌هاي بزرگي چون IBM، ALIT، Philips و Microsoft سالانه هزينه‌هاي هنگفتي را براي اين منظور پرداخت کرده و مي‌كنند. به عنوان يک کاربر کامپيوتر، احتمالاً با قابليت گفتاري مجموعه آفيس به عنوان يكي از ويژگي‌هاي جذاب و تا حدي فانتزي برخورد كرده و يا با آن كار كرده‌ايد. به کمک اين قابليت شما به جاي استفاده از صفحه كليد براي تايپ مطالبتان، به راحتي با خواندن متن مورد نظر و انتقال گفتارتان به كمك يك ميكروفون معمولي به کامپيوتر، آنرا در محيط Word تايپ شده مي‌بينيد. حتي براي ذخيره كردن، کپي کردن، گذاشتن عكس در متن و . . . به جاي كليك‌هاي پشت سر هم و گاهي با تعداد بالا، مي‌توانيد فرمان مربوطه را به كمك گفتار به نرم‌افزار داده تا كار شما را انجام دهد. جداي از اينكه توانايي درست كاركردن اين قابليت آفيس چقدر باشد، يك محدوديت بزرگ در سر راه استفاده از آن براي ما ايرانيان وجود دارد: اين قابليت فقط براي زبان انگليسي است. (البته زبان‌هاي چيني يا ژاپني را نيز مي‌توان استفاده كرد!). ايجاد چنيني سيستمي كه آنرا تشخيص يا بازشناسي گفتار (Speech recognition) مي‌نامند، در زبان فارسي، چندين سال از تحقيقات محققان، اساتيد و دانشجويان دانشگاه‌هاي مختلف كشور را به خود اختصاص داده است. اما جدي‌ترين جهشي كه در حدود ده سال پيش در اين زمينه ايجاد شد، ايجاد دادگان گفتاري فارس‌دات و يك سيستم اوليه تشخيص گفتار فارسي در مركز هوشمند علائم بوده است. در ادامه و در طي يکي-دو سال اخير، مهم‌ترين دستاورد در اين تكنولوژي براي زبان فارسي، سيستم‌هاي تشخيص گفتار شركت عصرگويش پرداز (ASR Gooyesh Pardaz ) http://www.asr-gooyesh.com است. اين شركت که توسط گروهي از اساتيد و دانشجويان دانشگاه صنعتي شريف ايجاد شده است، تنها فعاليت تخصصي خود را در زمينه پردازش سيگنال گفتار و بويژه تشخيص‌خودكار آن قرار داده است و نرم‌افزارهايي را براي انجام كار تشخيص خودكار گفتار توسعه داده است. نرم‌افزار نويسا كه براي ديكته خودكار مي‌باشد و نرم‌افزار نيوشا كه جهت تشخيص گفتار از پشت خط تلفن توسعه داده شده است، از دستاوردهاي آنهاست. از نظر فني، معيارهايي چون وابسته يا متعلق بوده به گوينده بودن سيستم، اندازه و تعداد واژگان، پيوسته يا گسسته بودن گفتار ورودي، استفاده از محدوديت‌هاي زباني و كارايي در محيط‌هاي واقعي توانمندي سيستم‌هاي تشخيص گفتار را مشخص مي‌كند. در كاربردهايي مانند تشخيص گفتار تلفني، اطن سيستم لزوماً بايد مستقل از گوينده باشند اما سيستم ديكته مي‌تواند وابسته به گوينده خاص باشد و براي آن گوينده سيستم بهترين كارايي را داشته باشد. در كاربردهاي واقعي معمولاً سيستم را مستقل از گوينده مي‌سازند و موقع استفاده به صداي گوينده خاصي آنرا اصطلاحاً تطبيق مي‌كنند. اين كار در قابليت گفتاري مجموعه آفيس به كمك خواندن متون اوليه در ويزارد سيستم انجام مي‌شود، چنين قابليتي در سيستم نويسا نيز وجود دارد. هر چه تعداد واژگاني كه سيستم مي‌تواند تشخيص دهد بيشتر باشد، شباهت ميان كلمات بيشتر شده و در نتيجه كارايي سيستم به ‌علت افزايش اشتباهات كاهش پيدا مي‌كند. از اينر‌رو در كاربرداهاي واقعي معمولآً فقط واژگان متناسب با كاربرد مورد نظر را انتخاب مي‌كنند تا محدود شود. در قابليت گفتاري آفيس هم كه ادعا مي‌شود اكثر كلمات انگليسي را دارد، كارايي به شدت پايين است (كارايي پايين آن به علت اين است كه ما غيرانگليسي زبان هستيم!) ولي در محصولات محدودتر اين شركت مانند قابليت گفتار I-mate كارايي به مراتب بهتر است. گفتار كاربر مي‌تواند پيوسته و طبيعي و يا با مكث ميان كلمات همراه باشد، بديهي است كه حالت اول مطلوب هركاربري است. يكي از مشكلاتي كه محصولات نويسا و نيوشا تا حدي زيادي آن را حل كرده‌اند، استخراج و به‌كارگيري قابليت‌هاي زباني، زبان فارسي در حد نسبتاً کاملي است. اين اطلاعات زباني مي‌تواند در ساير نرم‌افزارهايي كه نياز به اطلاعات زباني دارند، مانند مترجم‌ها و نرم‌افزارهاي OCR نيز بكار گرفته شود. اثر صداهاي اضافي و ناخواسته در كاربردهاي واقعي نرم‌افزارهاي تشخيص گفتار را در عمل دچار افت شديد كارايي مي‌نمايد، در محصولات فارسي ارائه شده با رويكردهاي مختلفي اين نقصان تا حد زيادي جبران شده است. برخي از محصولات مشتق شده از نرم‌افزارهاي تشخيص گفتار فارسي نويسا و نيوشا كه در حال حاضر توسعه داده شده‌اند، بصورت زير است:

+ ديكته خودکار متون فارسي با قابليت تطبيق به صداي گوينده و محيط کار، تطبيق واژگان مورد استفاده متناسب با کاربرد و قابليت استفاده در هر محيط ويرايشي در ويندوز
+ منشي خودكار تلفني: به جاي استفاده از سيستم تُن، فرد تماس‌گيرنده مي‌تواند فقط اسم شخص مورد نظر، بخش مورد نظر و يا با بيان گفتاري شماره‌ي داخلي، به مقصد وصل شود.
+ سيستم‌هاي اطلاع رساني گويا براي نداي گوياي قرآن، نداي بهداشت و اطلاعات‌رساني در مورد سازمان‌هاي کشور.
+ اتوماسيون خانگي و صنعتي جهت كنترل گفتاري وسايل منزل چه در خارج از خانه و چه به كمك خط تلفن و كنترل ربات‌ها و ساير وسايل صنعتي به كمك گفتار.
+ فرامين صوتي در كامپيوتر براي اجراي صوتي نرم‌افزار و برنامه‌هاي مورد نظر و استفاده از اين فرامين در نرم افزارهاي خاص مثل M.S. Office يا Media Player براي انجام كارهاي لازم. 
+ تايپ هوشمند با پيش‌بيني كلمه/كلمات مورد نظر كاربر در هنگام تايپ. 
+ مترجم صوتي براي ترجمه گفتار فارسي به زبان انگليسي براي عبارات مکالمه‌اي رايج با قابليت استفاده روي PDAها.