స్పీచ్ రికగ్నిషన్

వికీపీడియా నుండి
Jump to navigation Jump to search

స్పీచ్ రికగ్నిషన్ అనేది కంప్యూటర్ సైన్స్, కంప్యూటేషనల్ లింగ్విస్టిక్స్ యొక్క ఇంటర్ డిసిప్లినరీ సబ్‌ఫీల్డ్, ఇది కంప్యూటర్ల ద్వారా మాట్లాడే భాషను టెక్స్ట్‌గా గుర్తించడం, అనువదించడం ప్రారంభించే పద్ధతులు, సాంకేతికతలను అభివృద్ధి చేస్తుంది. దీనిని ఆటోమేటిక్ స్పీచ్ రికగ్నిషన్ (ASR), కంప్యూటర్ స్పీచ్ రికగ్నిషన్ లేదా స్పీచ్ టు టెక్స్ట్ (STT) అని కూడా అంటారు. ఇది కంప్యూటర్ సైన్స్, భాషాశాస్త్రం, కంప్యూటర్ ఇంజనీరింగ్ రంగాలలో జ్ఞానం, పరిశోధనలను కలిగి ఉంటుంది. దీనికి రివర్స్ ప్రక్రియ స్పీచ్ సింథసిస్.

కొన్ని స్పీచ్ రికగ్నిషన్ సిస్టమ్‌లకు "సోలీ" (దీనిని "నమోదు" అని కూడా పిలుస్తారు) అవసరం, ఇక్కడ ఒక వ్యక్తి వక్త సిస్టమ్‌లోకి వచనం లేదా వివిక్త పదజాలం చదువుతారు. సిస్టమ్ వ్యక్తి యొక్క నిర్దిష్ట స్వరాన్ని విశ్లేషిస్తుంది, ఆ వ్యక్తి యొక్క ప్రసంగం యొక్క గుర్తింపును చక్కగా ట్యూన్ చేయడానికి ఉపయోగిస్తుంది, ఫలితంగా కచ్చితత్వం పెరుగుతుంది. శిక్షణను ఉపయోగించని వ్యవస్థలను "స్పీకర్-ఇండిపెండెంట్" [1] వ్యవస్థలు అంటారు. శిక్షణను ఉపయోగించే వ్యవస్థలను "స్పీకర్ డిపెండెంట్" అంటారు.

ఇవి కూడా చూడండి

[మార్చు]

మూలాలు

[మార్చు]
  1. "Speaker Independent Connected Speech Recognition- Fifth Generation Computer Corporation". Fifthgen.com. Archived from the original on 11 November 2013. Retrieved 15 June 2013.