స్పీచ్ సింథసిస్

వికీపీడియా నుండి
Jump to navigation Jump to search

స్పీచ్ సింథసిస్ అనేది మానవ ప్రసంగం యొక్క కృత్రిమ ఉత్పత్తి. ఈ ప్రయోజనం కోసం ఉపయోగించే కంప్యూటర్ సిస్టమ్‌ను స్పీచ్ సింథసైజర్ అంటారు, సాఫ్ట్‌వేర్ లేదా హార్డ్‌వేర్ ఉత్పత్తులలో అమలు చేయవచ్చు. టెక్స్ట్-టు-స్పీచ్ (TTS) సిస్టమ్ సాధారణ భాషా వచనాన్ని ప్రసంగంగా మారుస్తుంది; ఇతర సిస్టమ్‌లు ఫోనెటిక్ ట్రాన్స్‌క్రిప్షన్‌ల వంటి సింబాలిక్ భాషా ప్రాతినిధ్యాలను ప్రసంగంలోకి అందిస్తాయి.[1] దీనికి రివర్స్ ప్రక్రియ స్పీచ్ రికగ్నిషన్.

డేటాబేస్‌లో నిల్వ చేయబడిన రికార్డ్ చేయబడిన ప్రసంగ భాగాలను సంగ్రహించడం ద్వారా సంశ్లేషణ చేయబడిన ప్రసంగాన్ని సృష్టించవచ్చు. నిల్వ చేయబడిన ప్రసంగ యూనిట్ల పరిమాణంలో సిస్టమ్స్ విభిన్నంగా ఉంటాయి; ఫోన్‌లు లేదా డైఫోన్‌లను నిల్వ చేసే సిస్టమ్ అతిపెద్ద అవుట్‌పుట్ పరిధిని అందిస్తుంది, కానీ స్పష్టత లేకపోవచ్చు. నిర్దిష్ట వినియోగ డొమైన్‌ల కోసం, మొత్తం పదాలు లేదా వాక్యాల నిల్వ అధిక-నాణ్యత అవుట్‌పుట్‌ను అనుమతిస్తుంది. ప్రత్యామ్నాయంగా, సింథసైజర్ పూర్తిగా "సింథటిక్" వాయిస్ అవుట్‌పుట్‌ను రూపొందించడానికి స్వర ట్రాక్ట్, ఇతర మానవ స్వర లక్షణాల నమూనాను పొందుపరచవచ్చు.[2]

ఇవి కూడా చూడండి

[మార్చు]

మూలాలు

[మార్చు]
  1. Allen, Jonathan; Hunnicutt, M. Sharon; Klatt, Dennis (1987). From Text to Speech: The MITalk system. Cambridge University Press. ISBN 978-0-521-30641-6.
  2. . "An articulatory synthesizer for perceptual research".