వివిక్త కొసైన్ పరివర్తనం

వికీపీడియా నుండి
ఇక్కడికి గెంతు: మార్గసూచీ, వెతుకు

ఒక వివిక్త కొసైన్ పరివర్తన (DCT ) అనేది వేర్వేరు పౌనఃపున్యాల వద్ద డోలనంలో ఉన్న కొసైన్ ఫంక్షన్‌ల మొత్తం వలె పరిమిత పలు డేటా పాయింట్ల క్రమాన్ని సూచిస్తుంది. DCTలు అనేవి సైన్స్ మరియు ఇంజినీరింగ్‌ల్లోని పలు అనువర్తనాలకు చాలా ముఖ్యమైనవిగా చెప్పవచ్చు, ఇవి ఆడియో మరియు చిత్రాల (స్వల్ప అధిక-పౌనఃపున్య విభాగాలు తొలగించబడతాయి) యొక్క లాసీ కంప్రెషన్ నుండి పాక్షిక అవకలన సమీకరణల యొక్క సంఖ్యా పరిష్కారాలకు వర్ణపట పద్ధతుల వరకు ఉపయోగపడుతుంది. ఈ అనువర్తనాల్లో సైన్ పంక్షన్‌లను కాకుండా కొసైన్ ఫంక్షన్‌లను ఉపయోగించడం చాలా క్లిష్టమైన అంశంగా చెప్పవచ్చు: సంపీడనానికి కొసైన్ ఫంక్షన్‌ల చాలా సమర్థవంతంగా పని చేస్తాయి (దిగువన వివరించినట్లు, ఒక సాధారణ సంకేతానికి కనీసం కొన్ని అయినా అవసరమవుతాయి), అదే అవకలన సమీకరణాలకు కొసైన్‌లు నిర్దిష్ట పరిమిత పరిస్థితులల్లో మాత్రమే పని చేస్తాయి.

ప్రత్యేకంగా, ఒక DCT అనేది వివిక్త ఫోరియెర్ పరివర్తనం (DFT)కు సంబంధించిన ఒక ఫోరియర్-సంబంధిత పరివర్తనంగా చెప్పవచ్చు, కాని ఇది సహజ సంఖ్యలను మాత్రమే ఉపయోగిస్తుంది. DCTలు అనేవి సరి సమరూపతతో సహజ డేటాపై అమలు అయ్యే సుమారు రెండు రెట్లు పొడవు గల DFTలకు సమానంగా ఉంటాయి (ఎందుకంటే ఫోరియర్ పరివర్తనం యొక్క ఒక సహజ మరియు సరి ఫంక్షన్ అనేది సహజ మరియు సరి), కొన్ని వైవిధ్యాల్లో, ఇన్‌పుట్ మరియు/లేదా అవుట్‌పుట్ డేటాలను సగం ప్రతిరూపానికి మార్చబడుతుంది. ఎనిమిది ప్రామాణిక DCT వైవిధ్యాలు ఉన్నాయి, వీటిలో నాలుగు సాధారణంగా కనిపిస్తాయి.

వివిక్త కొసైన్ పరివర్తనం యొక్క చాలా సాధారణ వైవిధ్యంగా రకం-II DCTని చెప్పవచ్చు, దీనిని సులువుగా "DCT" అని పిలుస్తారు; దీనికి విరుద్ధమైన రకం-III DCTని తరచూ "ఇన్వెర్స్ DCT" లేదా "IDCT"ని పిలుస్తారు. రెండు సంబంధిత పరివర్తనాల్లో సహజ మరియు బేసి ఫంక్షన్‌ల ఒక DFTకి సమానమైన వివిక్త సైన్ పరివర్తనం (DST) మరియు అతివ్యాప్తమయ్యే డేటా యొక్క ఒక DCTపై ఆధారపడి ఉండే సవరించబడిన వివిక్త కొసైన్ పరివర్తనం (MDCT)లు ఉన్నాయి.

అనువర్తనాలు[మార్చు]

DCT మరియు ప్రత్యేకంగా DCT-II అనే దానిని తరచూ సిగ్నల్ మరియు ఇమేజ్ ప్రాసెసింగ్‌లో ప్రత్యేకంగా లాసే డేటా సంపీడనంలో ఉపయోగిస్తారు, ఎందుకంటే ఇది బలమైన "శక్తి సంపీడన" లక్షణాన్ని కలిగి ఉంది (రావ్ మరియు యిప్, 1990): అధిక సంకేత సమాచారాలు DCT యొక్క తక్కువ స్వల్ప-పౌనఃపున్య విభాగాలపై కేంద్రీకరించబడతాయి, మార్కోవ్ విధానాల యొక్క నిర్దిష్ట పరిమితులపై ఆధారపడి సంకేతాల కోసం కార్హునెన్-లోయివ్ పరివర్తనంను (సహసంబంధరహిత భావంలో గరిష్టంగా ఉంటుంది) చేరుకుంటాయి. క్రింది వివరించినట్లు, ఇది కొసైన్ ఫంక్షన్‌ల్లో సరిహద్దు పరిస్థితుల అవ్యక్తతను ఆపివేస్తుంది.

DCT-II (దిగువన) అనేది ఒక ఇన్‌పుట్ సిగ్నెల్ (ఎగువన) యొక్క DFTతో (మధ్యలో ఉన్నది) సరిపోల్చబడింది.

ఒక సంబంధిత పరివర్తనం సవరించిన వివిక్త కొసైన్ పరివర్తనం లేదా MDCT (DCT-IV ఆధారంగా) అనేది AAC, వోర్బిస్, WMA, మరియు MP3 సంపీడనంలో ఉపయోగిస్తారు.

DCTలను వర్ణపట పద్ధతులచే పాక్షిక అవకలన సమీకరణలను పరిష్కరించడంలో కూడా విస్తృతంగా ఉపయోగిస్తారు, ఇక్కడ DCT యొక్క వేర్వేరు వైవిధ్యాలు అమరిక యొక్క రెండు చివరల వద్ద కొద్దిగా వేరుగా ఉండే సరి/బేసి సరిహద్దు పరిస్థితులకు సంబంధించి ఉంటాయి.

DCTలు చెబైషెవ్ బహుపదులకు సన్నిహిత సంబంధాన్ని కలిగి ఉంది మరియు చెబైషెవ్ బహుపదులచే ఏకపక్ష పంక్షన్‌ల యొక్క చెబైషివ్ అంచనాలో వేగవంతమైన DCT క్రమసూత్ర పద్ధతులను (దిగువం) ఉపయోగిస్తారు, ఉదాహరణకు క్లెన్షా-కుర్టిస్ వర్గీకరణంలో ఉపయోగిస్తారు.

JPEG[మార్చు]

DCTని JPEG ఇమేజ్ సంపీడనం, MJPEG, MPEG, DV మరియు Theora వీడియో సంపీడనాల్లో ఉపయోగిస్తారు. ఇక్కడ N \times N బ్లాక్స్ యొక్క ద్వి-మితీయ DCT-IIలను గణిస్తారు మరియు ఫలితాలను క్వాంటిజ్ చేస్తారు మరియు జడోష్ణత కోడ్‌గా మారుస్తారు. ఈ సందర్భంలో, N అనేది సాధారణంగా 8 మరియు DCT-II సూత్రం బ్లాక్ యొక్క ప్రతి అడ్డు వరుస మరియు నిలువ వరుసలకు వర్తించబడుతుంది. ఫలితంగా ఒక 8 × 8 పరివర్తనం గణాంక శ్రేణి వస్తుంది, దీనిలో (0,0) మూలకాన్ని (కుడి ఎగువ) DC భాగం చెబుతారు మరియు పెరుగుతున్న క్షితిజ లంబ మరియు క్షితిజ సమాంతర సూచిక విలువలతో నమోదులు ఉన్నత క్షితిజ లంబ మరియు క్షితిజ సమాంతర పౌనఃపున్యాలను సూచిస్తాయి.

అనధికార సారాంశం[మార్చు]

ఫోరియర్-సంబంధిత పరివర్తనం వలె, వివిక్త కొసైన్ పరివర్తనాలు (DCTలు) ఒక ఫంక్షన్ లేదా ఒక సంకేతాన్ని వేర్వేరు పౌనఃపున్యాలు మరియు డోలన పరిమితులతో సినుసాయిడ్‌ల ఒక మొత్తంగా సూచిస్తుంది. వివిక్త ఫోరియర్ పరివర్తనం (DFT) వలె, ఒక DCT వివిక్త డేటా పాయింట్ల ఒక పరిమిత సంఖ్య వద్ద ఒక ఫంక్షన్‌పై అమలు అవుతుంది. ఒక DCT మరియు ఒక DFTల మధ్య స్పష్టమైన వ్యత్యాసం ఏమిటంటే మొదటది కొసైన్ ఫంక్షన్‌లను మాత్రమే ఉపయోగిస్తుంది, రెండవది కొసైన్‌లు మరియు సైన్‌లను రెండింటినీ ఉపయోగించగలదు (సంక్లిష్ట ఘాతాలు రూపంలో). అయితే, ఈ స్పష్టమైన వ్యత్యాసం ఒక తీవ్ర విలక్షణ యొక్క ఒక పరిణామంగా చెప్పవచ్చు: ఒక DCT, DFT లేదా ఇతర సంబంధిత పరివర్తనాల వలె కాకుండా వేరే సరిహద్దు పరిస్థితులను సూచిస్తుంది.

DFT లేదా DCT లేదా ఒక ఫోరియర్ శ్రేణి వంటి ఒక పరిమిత డొమైన్‌ల ఒక ఫంక్షన్‌పై అమలు అయ్యే ఫోరియర్-సంబంధిత పరివర్తనాలను డొమైన్‌కు వెలుపల ఆ ఫంక్షన్ యొక్క ఒక విస్తరణ వలె పేర్కొనడానికి అని భావించవచ్చు. అంటే, మీరు సినుసాయిడ్‌ల మొత్తం వలె ఒక ఫంక్షన్ f(x)ను వ్రాసినప్పుడు, ఏదైనా xకు యదార్ధ f(x)ను పేర్కొనప్పటికీ, మీరు ఆ మొత్తాన్ని x వద్ద విశ్లేషించవచ్చు. ఫోరియర్ శ్రేణి వలె DFT యదార్ధ ఫంక్షన్‌కు ఒక ఆవర్తన విస్తరణను సూచిస్తుంది. ఒక కొసైన్ పరివర్తనం వలె ఒక DCT యదార్ధ ఫంక్షన్ యొక్క సరి విస్తరణను సూచిస్తుంది.

DCT యొక్క నాలుగు సాధారణ రకాలు (రకాలు I-IV) కోసం, N=11 డేటా పాయింట్ల్ కోసం (ఎర్ర బిందువులు) DCT ఇన్‌పుట్ డేటా యొక్క అవ్యక్త సరి/బేసి విస్తరణల యొక్క ప్రదర్శన.

అయితే, DCTలు పరిమిత , వివిక్త క్రమాలపై అమలు అవుతాయి కనుక, నిరంతర కొసైన్ పరివర్తనానికి వర్తించబడిన రెండు సమస్యలు ఎదురవుతాయి. మొదటిది, డొమైన్ యొక్క ఎడమ మరియు కుడి సరిహద్దులు రెండు వైపుల ఫంక్షన్ సరి లేదా బేసి అనే విషయాన్ని పేర్కొనాలి (అంటే, దిగువ ఉన్న వివరణలోని వరుసగా min-n and max-n సరిహద్దులు). రెండవది, ఈ ఫంక్షన్ సరి లేదా బేసి అనే విషయాన్ని ఏ అంశం సూచిస్తుందో పేర్కొనాలి. నిర్దిష్టంగా, నాలుగు సమాన దూరాల్లో ఉన్న డేటా పాయింట్ల యొక్క ఒక క్రమం abcd ని తీసుకోండి మరియు మనం ఒక సరి ఎడమ సరిహద్దును సూచించినట్లు భావించండి. ఇక్కడ రెండు ఊహామాత్ర అవకాశాలు ఉన్నాయి: నమూనా a గురించి డేటా సరి అయితే, ఈ సందర్భంలో సరి విస్తరణ అనేది dcbabcd అవుతుంది లేదా ఈ డేటా సుమారు a మరియు ముందు పాయింట్‌కు సగం దూరంలో సరి అయితే, ఈ సందర్భంలో సరి విస్తరణ dcbaabcd (a పునరావృతం అవుతుంది) అవుతుంది.

ఈ ఎంపికలు DCTలు అలాగే వివిక్త సైన్ పరివర్తనంల (DSTలు) యొక్క అన్ని ప్రామాణిక వైవిధ్యాలకు దారి తీసింది. ప్రతి సరిహద్దు సరి లేదా బేసి (సరిహద్దుకు 2 ఎంపికలు) కావచ్చు మరియు ఒక డేటా పాయింట్ లేదా 2\times2\times2\times2=16 అవకాశాల మొత్తానికి రెండు డేటా పాయంట్ల (సరిహద్దుకు 2 ఎంపికలు) మధ్య సగం దూరంలో అనురూపం కావచ్చు. ఈ ఆస్కారాల్లో సగం, DCT యొక్క 8 రకాలకు సంబంధించి ఎడమ సరిహద్దు అనేది సరి అవుతుంది; మిగిలిన సగం DST యొక్క 8 రకాలు అవుతాయి.

ఈ వేర్వేరు సరిహద్దు పరిస్థితులు అనువర్తనాల పరివర్తనాన్ని తీవ్రంగా ప్రభావితం చేస్తాయి మరియు పలు DCT రకాలకు ప్రత్యేక ప్రయోజన లక్షణాలకు కారణమవుతాయి. మరింత స్పష్టంగా, వర్ణపట పద్ధతులచే పాక్షిక అవకలన సమీకరణాలను పరిష్కరించడానికి ఫోరియర్-సంబంధిత పరివర్తనాలను ఉపయోగిస్తున్నప్పుడు, సరిహద్దు పరిస్థితులను నేరుగా పరిష్కరించవల్సిన సమస్యలో భాగంగా పేర్కొంటారు. లేదా MDCT (రకం-IV DCT ఆధారంగా) కోసం, సరిహద్దు పరిస్థితులు రద్దుకు మారుపేరు వలె సమయ-డొమైన్ యొక్క MDCT యొక్క సంక్లిష్ట లక్షణంలో అధికంగా పాల్గొంటాయి. మరింత అనుకూలమైన రీతిలో, సరిహద్దు పరిస్థితులు DCTలను ఇమేజ్ మరియు ఆడియో సంపీడనానికి ఉపయోగించేలా చేసే "శక్తి సంపీడన" లక్షణాలకు బాధ్యత వహిస్తాయి, ఎందుకంటే సరిహద్దులు ఏదైనా ఫోరియర్-వంటి శ్రేణి యొక్క అభిసరణ రేటును ప్రభావితం చేస్తాయి.

నిర్దిష్టంగా, ఒక ఫంక్షన్‌లో ఏదైనా విరమణలు ఫోరియర్ శ్రేణి యొక్క అభిసరణ రేటును తగ్గిస్తాయి, కనుక ఇవ్వబడిన ఖచ్చితత్వంతో ఫంక్షన్‌ను సూచించడానికి మరిన్ని సోనుసోయిడ్‌లు అవసరమవుతాయి. ఇదే సూత్రం సంకేత సంపీడనానికి DFT మరియు ఇతర పరివర్తనాల వాడకాన్ని నిర్వహిస్తుంది: ఒక ఫంక్షన్ సున్నితంగా ఉంటే, దానిని ఖచ్చితంగా సూచించడానికి దాని DFT మరియు DCTలో స్వల్ప అంశాలు అవసరమవుతాయి మరియు అది మరింతగా సంపీడనం చేయబడుతుంది. (ఇక్కడ, మనం దాని "సున్నితత్వం" గురించి మాట్లాడటానికి, DFT లేదా DCTను వరుసగా ఒక ఫంక్షన్ యొక్క ఫోరియర్ శ్రేణి లేదా కొసైన్ శ్రేణికి అంచనాలుగా చెప్పవచ్చు.) అయితే, DFT యొక్క అవ్యక్త ఆవర్తకత వలన సాధారణంగా సరిహద్దుల్లో విరమణులు ఎక్కువగా సంభవిస్తాయని తెలుస్తుంది: ఒక సంకేతం యొక్క ఏదైనా యాదృచ్ఛిక భాగం అనేది ఎడమ మరియు కుడి సరిహద్దులు రెండింటి వద్ద ఒకే విలువను కలిగి ఉండదు. (DSTలో కూడా ఇదే రకమైన సమస్య ఏర్పడుతుంది, దీనిలో బేసి ఎడమ సరిహద్దు స్థితి సరిహద్దు వద్ద సున్నా కాని ఏదైనా ఫంక్షన్‌కు ఒక విరమణను సూచిస్తుంది.) దీనికి విరుద్ధంగా, రెండు సరిహద్దులను సరి అయిన ఒక DCT ఎల్లప్పుడూ సరిహద్దుల వద్ద ఒక నిరంతర విస్తరణను అందిస్తుంది (అయితే వాలు సాధారణంగా విరమణలో ఉంటుంది). ఇందువలనే DCTలు మరియు ప్రత్యేకంగా DCTల రకాలు I, II, V మరియు VI (రెండు సరి సరిహద్దులను కలిగి ఉన్న రకాలు) సాధారణంగా సంకేత సంపీడనానికి DFTల మరియు DSTల కంటే ఉత్తమంగా పనిచేస్తుంది. ఆచరణలో, ఒక రకం-II DCTను గణన అనుకూలతకు కారణాల్లో భాగంగా సాధారణంగా ఇటువంటి అనువర్తనాలకు సూచించబడుతుంది.

లాంఛనప్రాయ వివరణ[మార్చు]

లాంఛనప్రాయంగా, వివిక్త కొసైన్ పరివర్తనం అనేది ఒక దీర్ఘ విలోమ ఫంక్షన్ F : R N -> R N (ఇక్కడ R సహజ సంఖ్యల సమితిని సూచిస్తుంది) లేదా సమానమైన ఒక విలోమ N × N చతురస్ర మాత్రిక. ఇక్కడ కొద్దిగా సవరించబడిన వివరణలతో DCT యొక్క పలు వైవిధ్యాలు ఉన్నాయి. క్రింది సూత్రాల్లో ఒకదానిని అనుసరించి N సహజ సంఖ్యలు x 0, ..., x N -1, N సహజ సంఖ్యలు X 0, ..., X N -1 వలె రూపాంతరం చెందుతాయి:

DCT-I[మార్చు]

X_k = \frac{1}{2} (x_0 + (-1)^k x_{N-1}) + \sum_{n=1}^{N-2} x_n \cos \left[\frac{\pi}{N-1} n k \right] \quad \quad k = 0, \dots, N-1.

కొంతమంది రచయితలు ఇంకా x 0 మరియు x N -1 పదాలను √2చే గుణిస్తారు మరియు ఇదే విధంగా X 0 మరియు X N -1 పదాలను 1/√2చే గుణిస్తారు. దీని వలన DCT-I మాత్రిక లంబకోణీయం అవుతుంది, ఇంకా \sqrt{2/(N-1)} యొక్క మొత్తం స్థాయి కారకంతో గుణించబడుతుంది, కాని ఒక సహజ-సరి DFTతో ప్రత్యక్ష సంబంధాన్ని తొలగిస్తుంది.

DCT-I అనేది ఖచ్చితంగా సరి సమరూపతతో 2N-2 సహజ సంఖ్యల యొక్క ఒక DFTకు సమానంగా (2 యొక్క మొత్తం స్థాయి కారకం వరకు) ఉంటుంది. ఉదాహరణకు, N =5 సహజ సంఖ్యలు abcde అనేది ఖచ్ఛితంగా ఎనిమిది సహజ సంఖ్యల abcdedcb (సరి సమరూపత) యొక్క ఒక DFTను రెండుచే విభజించగా వచ్చిన ఫలితానికి సమానంగా ఉంటుంది. (దీనికి విరుద్ధంగా, DCT రకాలు II-IVలో సమానమైన DFTలో ఒక సగం-నమూనా వంతుకు సమానంగా ఉంటుంది.)

అయితే 2 కంటే తక్కువగా ఉండే N కోసం DCT-I నిర్వచించలేదని గమనించండి. (అన్ని ఇతర DCT రకాలు ఏదైనా ధనాత్మక N కు నిర్వచించబడతాయి.)

ఈ విధంగా, DCT-I సరిహద్దు స్థితులకు సంబంధించి ఉంటుంది: x n అనేది n =0 సమీప సరి మరియు n =N -1కు కూడా సరిగా ఉంటుంది; అదే విధంగా X k కూడా.

DCT-II[మార్చు]

X_k = \sum_{n=0}^{N-1} x_n \cos \left[\frac{\pi}{N} \left(n+\frac{1}{2}\right) k \right] \quad \quad k = 0, \dots, N-1.

DCT-II అనేది చాలా సర్వసాధారణంగా ఉపయోగించే రూపం మరియు తరచూ ఇది "DCT" వలె సూచించబడుతుంది.

ఈ పరివర్తనం ఖచ్చితంగా సరి సమరూపత యొక్క 4N సహజ ఇన్‌పుట్‌ల యొక్క ఒక DFTకు సమానంగా (2 యొక్క మొత్తం స్థాయి కారకం యొక్క) ఉంటుంది, ఇక్కడ సరి-పదసూచిక అంశాలు సున్నా. అంటే, ఇది 4N ఇన్‌పుట్‌ల యొక్క DFTలో సగం ఉంటుంది, ఇక్క 0 \leq n కోసం y_{2n}=0, y_{2n+1} = x_n మరియు 0 కోసం y_{4N-n}=y_n.

ఇంకా కొంతమంది రచయితలు X 0 పదాన్ని 1/√2తో గుణిస్తారు మరియు ఫలిత మాత్రికను \sqrt{2/N} యొక్క సంపూర్ణ స్థాయి కారకంచే గుణించాలి (DCT-IIIలో సంబంధిత మార్పు కోసం క్రింద చూడండి). ఇది DCT-II మాత్రికను లంబకోణీయం చేస్తుంది, కాని పాక్షిక-మార్పు ఇన్‌పుట్ యొక్క ఒక సహజ-సరి DFTతో ప్రత్యక్ష సంబంధాన్ని కలిగి ఉంటుంది.

DCT-II సరిహద్దు స్థితులను సూచిస్తుంది: x n అనేది n =-1/2 సమీపంగా సరి మరియు n =N -1/2కు సమీపంగా సరి అవుతుంది; X k అనేది k =0కు సమీపంగా సరి మరియు k =N కు సమీపంగా బేసి ఉంటుంది.

DCT-III[మార్చు]

X_k = \frac{1}{2} x_0 + \sum_{n=1}^{N-1} x_n \cos \left[\frac{\pi}{N} n \left(k+\frac{1}{2}\right) \right] \quad \quad k = 0, \dots, N-1.

ఇది DCT-II యొక్క విలోమం కనుక, దీని రూపం కొన్నిసార్లు "DCT విలోమం" వలె సూచిస్తారు ("IDCT").

కొంతమంది రచయితలు x 0 పదాన్ని √2చే గుణిస్తారు మరియు ఫలిత మాత్రికను \sqrt{2/N} యొక్క మొత్తం స్థాయి కారకంచే గుణించాలి (DCT-IIలో సంబంధిత మార్పు కోసం పైన చూడండి), దీని వలన DCT-II మరియు DCT-IIIలు ఒకదానికొకటి మార్పు చెందుతాయి. ఇది DCT-III మాత్రికను లంబకోణీయం చేస్తుంది, పాక్షిక-మార్పు అవుట్‌పుట్ యొక్క ఒక సహజ-సరి DFTతో ప్రత్యక్ష సంబంధాలను తొలగిస్తుంది.

DCT-III సరిహద్దు స్థితులను సూచిస్తుంది: x n అనేది n =0 సమీపంలో సరి మరియు n =N సమీపంలో బేసి అవుతుంది; X k అనేది k =-1/2 సమీపంలో సరి మరియు k =N -1/2 సమీపంలో సరి అవుతుంది.

DCT-IV[మార్చు]

X_k = \sum_{n=0}^{N-1} x_n \cos \left[\frac{\pi}{N} \left(n+\frac{1}{2}\right) \left(k+\frac{1}{2}\right) \right] \quad \quad k = 0, \dots, N-1.

\sqrt{2/N} యొక్క మొత్తం స్థాయి కారకంతో ఇంకా గుణిస్తే, DCT-IV మాత్రిక లంబకోణీయం అవుతుంది (మరియు స్పష్టమైన సమరూపంగా ఉన్నందుకు, ఇది స్వీయ విలోమం).

వేర్వేరు పరివర్తనాల నుండి డేటా అతివ్యాప్తి అవుతున్న DCT-IV యొక్క ఒక వైవిధ్యం సవరించబడిన వివిక్త కొసైన్ పరివర్తనం (MDCT) (మాల్వార్, 1992)గా పిలుస్తారు.

DCT-IV సరిహద్దు స్థితులను సూచిస్తుంది: x n అనేది n =-1/2 సమీపంలో సరి మరియు n =N -1/2 సమీపంలో బేసి అవుతుంది; అదే విధంగా X k కూడా.

DCT V-VIII[మార్చు]

DCT రకాలు I-IV అనేవి సరి క్రమం యొక్క సహజ-సరి DFTలకు సమానంగా ఉంటుంది (N అనేది సరి లేదా బేసి అనే అంశంతో సంబంధం లేకుండా), కనుక సంబంధిత DFT అనేది 2(N −1) (DCT-Iకి) లేదా 4N (DCT-II/IIIకి) లేదా 8N (DCT-VIIIకి) పొడవు ఉంటుంది. సూత్రంలో, ఇక్కడ వాస్తవానికి వివిక్త కొసైన్ పరివర్తనం యొక్క నాలుగు అదనపు రకాలు ఉన్నాయి (మార్టుసీ, 1994), ఇవి తార్కికంగా బేసి క్రమం యొక్క సహజ-సరి DFTలకు అవసరంగా సంబంధించి ఉంటుంది, ఇవి కొసైన్ అంశాల్లోని విభాజకంలో N ±½ యొక్క కారకాలను కలిగి ఉంటుంది.

సమీకరణం ప్రకారం, I-IV రకాల DCTలు రెండు సరిహద్దులకు లేదా రెండు సరిహద్దులు కోసం రెండు డేటా పాయింట్ల మధ్య సగం సమీపంలో సరి/బేసి సరిహద్దులను సూచిస్తాయి. V-VIII రకాల DCTలు ఒక సరిహద్దు కోసం ఒక డేటా పాయింట్ మరియు ఇతర సరిహద్దు కోసం రెండు డేటా పాయింట్ల మధ్య సగానికి సమీపంలో సరి/బేసి సరిహద్దులకు సూచిస్తాయి.

అయితే, ఈ వైవిధ్యాలను ఆచరణలో చాలా అరుదుగా ఉపయోగిస్తారు. అయితే, ఒక కారణం ఏమిటంటే బేసి-పొడవు DFTలకు FFT క్రమసూత్ర పద్ధతులు అనేవి సాధారణంగా సరి-పొడవు DFTలకు FFT క్రమసూత్ర పద్ధతుల కంటే మరింత క్లిష్టంగా ఉంటాయి (ఉదా. సులభమైన రాడిక్స్-2 క్రమసూత్ర పద్ధతులు సరి పొడవులకు మాత్రమే) మరియు ఈ అధిక క్లిష్టత దిగువన పేర్కొన్న విధంగా DCTలకు చేర్చబడుతుంది.

(ఒక అల్ప సహజ-సరి శ్రేణి, ఒక ఏకైక సంఖ్య a యొక్క ఒక పొడవైన DFT (బేసి పొడవు), N =1 పొడవు యొక్క ఒక a DCT-Vకి సంబంధించి ఉంటుంది.)

విలోమ పరివర్తనలు[మార్చు]

పైన ఉన్న పేర్కొన్న సాధారణీకరణ పద్ధతులను ఉపయోగించి, DCT-I యొక్క విలోమం 2/(N -1)చే గుణించబడిన DCT-I అవుతుంది. DCT-IV యొక్క విలోమంగా DCT-IV 2/N గుణించబడతుంది. DCT-II యొక్క విలోమంగా 2/N చే గుణించబడిన DCT-IIIగా చెబుతారు మరియు ఇలా విలోమ దశలో కూడా జరుగుతుంది. (ఉదా. రావ్ & యిప్, 1990 చూడండి.)

DFT వలె, ఈ పరివర్తన వివరముల ఆధ్వర్యంలో సాధారణీకరణ కారకం అనేది దాదాపు ఒక ఆచారం మరియు వివరణలో వేరేగా ఉంటుంది. ఉదాహరణకు, కొంతమంది రచయితలు \sqrt{2/N}చే పరివర్తనలను గుణిస్తారు, కనుక విలోమానికి ఎలాంటి అదనపు గుణకార కారకం అవసరం లేదు. √2 యొక్క అనుకూలమైన కారకాలతో కలిపి (పైన చెప్పండి), దీనిని పరివర్తన మాత్రిక లంబకోణీయం చేయడానికి ఉపయోగించబడుతుంది.

బహుపరిమాణ DCTలు[మార్చు]

పలు DCT రకాల బహుపరిమాణ వైవిధ్యాలు ఏక-పరిమాణాత్మక వివరాల నుండి ప్రత్యక్షంగా అనుసరిస్తుంది: అవి ప్రతి పరిమాణాత్మకతతో పాటు DCTల యొక్క ఒక ప్రత్యేక ఉత్పత్తిగా (దాదాపు సంవిధానంగా ఉంటుంది) ఒక చెప్పవచ్చు.

ఉదాహరణకు, ఒక చిత్రం లేదా ఒక మాత్రిక యొక్క ఒక ద్వి-మితీయ DCT-II అనేది పై నుండి చూస్తే సాధారణ ఏక-మితీయ DCT-II, అడ్డు వరుసలకు అమలు అవుతుంది తర్వాత నిలువు వరుసలకు వర్తించబడుతుంది (లేదా వ్యతిరేకంగా జరుగుతుంది). అంటే, 2d DCT-II అనేది సూత్రంచే క్రింది విధంగా సూచించబడుతుంది (పైన పేర్కొన్నట్లు సాధారణీకరణ మరియ ఇతర స్థాయి కారకాలు తొలగించబడ్డాయి):

X_{k_1,k_2} = \sum_{n_1=0}^{N_1-1} \sum_{n_2=0}^{N_2-1} x_{n_1,n_2} \cos \left[\frac{\pi}{N_1} \left(n_1+\frac{1}{2}\right) k_1 \right] \cos \left[\frac{\pi}{N_2} \left(n_2+\frac{1}{2}\right) k_2 \right] .
ద్వి-మితీయ DCT ఫౌనఃపున్యాలు

సాంకేతికంగా, ప్రతి మితీయ పరంగా ఏకైక-మితీయ DCTల యొక్క క్రమంచే ఒక ద్వి- (లేదా బహు-) మితీయ DCTను లెక్కించడం అనేది ఒక నిలువు-అడ్డు వరుసల క్రమసూత్ర పద్ధతిగా పిలుస్తారు (ద్వి-మితీయ సందర్భం నుండి తీసుకున్నారు). అయితే బహుమితీయ FFT క్రమసూత్ర పద్ధతులతో, గణనలను వేరొక పద్ధతిలో నిర్వహించేటప్పుడు, ఇదే అంశాన్ని లెక్కించడానికి ఇతర పద్ధతులు కూడా ఉన్నాయి (అంటే, వేర్వేరు కొలతలకు క్రమసూత్ర పద్ధతులను సరఫరా/విలీనం చేయడం).

బహు-మితీయ DCT యొక్క విలోమం అనేది సంబంధిత ఏక-మితీయ DCT(లు) యొక్క విలోమాల యొక్క ఒక ప్రత్యేక గుణకారలబ్ధంగా చెప్పవచ్చు (పైన చూడండి), ఉదా. ఏక-మితీయ విలోమాలు ఒక సమయంలో ఏక మితీయ అంశంతో ఒక అడ్డు-నిలువు వరుసల క్రమసూత్ర పద్ధతిలో వర్తించబడతాయి.

కుడివైపున ఉన్న చిత్రం ఒక 8 x 8 (N_1 = N_2 = 8) ద్వి-మితీయ DCTకు క్షితిజ సమాంతర మరియు క్షితిజ లంబం పౌనఃపున్యాల కలయికను ప్రదర్శిస్తుంది. ఎడమ నుండి కుడికి మరియు పై నుండి క్రిందికి ప్రతి దశలో పౌనఃపున్యం 1/2 వర్తులంచే పెంచబడింది. ఉదాహరణకు, ఎగువ-ఎడమ చతురస్రం నుండి కుడివైపున ఉన్న దాని తరలించడం వలన క్షితిజ సమాంతర పౌనఃపున్యంలో ఒక సగం-వర్తులం పెరుగుదల కనిపిస్తుంది. కుడివైపుకు మరొక కదలిక రెండు సగం-వర్తులాలకు కారణమవుతుంది. క్రిందికి కదలిక వలన క్షితిజ సమాంతరంగా రెండు సగం-వర్తులాలు మరియు క్షితిజ లంబంగా ఒక సగం-వర్తులం కారణమవుతుంది. సోర్స్ డేటా (8x8) ఈ 64 పౌనఃపున్య చతురస్రాల యొక్క ఒక రేఖీయ కలయికకు పరావర్తనమవుతుంది.

గణన[మార్చు]

ఈ సూత్రాల యొక్క ప్రత్యక్ష అనువర్తనానికి O(N 2) కార్యాచరణలు అవసరమైనప్పటికీ, వేగవంతమైన ఫోరియర్ పరివర్తన (FFT)లో వలె గణనను విభజించడం ద్వారా O(N log N ) క్లిష్టత మాత్రమే దీనినే గణించడం సాధ్యమవుతుంది. మరొక విధంగా, O(N ) పూర్వ- మరియు తదుపరి-ప్రాసెసింగ్ దశలతో కలిపి FFTల ద్వారా కూడా DCTలను గణించవచ్చు. సాధారణంగా, DCTలను లెక్కించడానికి O(N log N ) పద్ధతులను వేగవంతమైన కొసైన్ పరివర్తన (FCT) క్రమసూత్ర పద్ధతులుగా పిలుస్తారు.

సిద్ధాంతం ప్రకారం, చాలా సమర్థవంతమైన క్రమసూత్ర పద్ధతులు అనేవి సాధారణంగా ఒక సాధారణ FFTతో O(N ) అదనపు కార్యాచరణలను ఉపయోగించడానికి బదులుగా DCT కోసం ప్రత్యేకంగా రూపొందించబడ్డాయి (ఒక మినహాయింపు కోసం క్రింద చూడండి). అయితే, "ప్రత్యేకమైన" DCT క్రమసూత్ర పద్ధతులు (అంకాల సంఖ్యల అని పిలవబడే అత్యల్ప విలువను ఫలితంగా ఇచ్చే అన్నింటితో సహా, కనీసం పవర్ ఆఫ్ టూ పరిమాణాలకు) అనేవి సాధారణంగా FFT క్రమసూత్ర పద్ధతులకు చాలా సారూప్యతలను కలిగి ఉంటాయి-DCTలు ఖచ్చితంగా సహజ-సరి డేటాకు DFTలు అయ్యిండాలి కనుక, మనం ఒక FFTని తీసుకుని, ఈ సమరూపత కారణంగా పునరావృత కార్యాచరణలను తొలగించడం ద్వారా ఒక వేగవంతమైన DCT క్రమసూత్ర పద్ధతిని రూపొందించవచ్చు. దీనిని స్వయంచాలకంగా కూడా చేయవచ్చు (ప్రిగో & జాన్సన్, 2005). కూలే-టర్కే FFT క్రమసూత్ర పద్ధతులపై ఆధారపడిన క్రమసూత్ర పద్ధతులు సర్వసాధారణం, కాని ఏదైనా ఇతర FFT క్రమసూత్ర పద్ధతి కూడా వర్తించబడుతుంది. ఉదాహరణకు, వినోగ్రాడ్ FFT క్రమసూత్ర పద్ధతి DFT కోసం కనిష్ట-గుణకార క్రమసూత్ర పద్ధతులను రూపొందించింది, అయితే సాధారణంగా మరిన్ని అదనపు చేర్పులు ఉన్నాయి మరియు DCT కోసం ఇదే విధమైన ఒక క్రమసూత్ర పద్ధతి ఫెయిగ్ & వినోగార్డ్ (1992)చే ప్రతిపాదించబడింది. DFTలు, DCTలు మరియు ఇతర పరివర్తనాలు చాలా సమీప సారూప్యతలను కలిగి ఉన్న కారణంగా, ఒక పరివర్తనం కోసం ఏదైనా క్రమసూత్ర పద్ధతిలో ఏదైనా మెరుగుదల ఉంటే, అది సిద్ధాంతపరంగా ఇతర పరివర్తనాలకు కూడా తక్షణ ప్రయోజనాలను అందిస్తుంది (డుహామెల్ & వెటెర్లీ, 1990).

ఒక స్థిర FFTను అమలు చేసే DCT క్రమసూత్ర పద్ధతులు తరచూ ఉత్తమ ప్రత్యేక DCT క్రమసూత్ర పద్ధతుల్లో పోల్చినప్పుడు సిద్ధాంతపరంగా కొంచెం మెరుగ్గా ఉంటాయి, DCT క్రమసూత్ర పద్ధతులు ఒక విశిష్టమైన ప్రయోజనాన్ని కూడా కలిగి ఉన్నాయి: అధిక ఉత్తమ FFT ప్రోగ్రామ్‌లు విస్తృతంగా అందుబాటులో ఉన్నాయి. కనుక, ఆచరణలో, సాధారణ పొడవులు N కోసం తరచూ FFT-ఆధారిత క్రమసూత్ర పద్ధతులతో ఉన్నత పనితీరును పొందడం చాలా సులభంగా మారింది. (ఆధునిక హార్డ్‌వేర్‌లో పనితీరు అనేది సాధారణంగా అంకాల లెక్కింపుచే మాత్రమే సరిపోదు మరియు ఆప్టిమైజేషన్‌కు తగినంత ఇంజినీరింగ్ కృషి కూడా అవసరమవుతుంది.) మరొక విధంగా, ప్రత్యేకమైన DCT క్రమసూత్ర పద్ధతులు చిన్న, స్థిర పరిమాణాల యొక్క పరివర్తనాలకు విస్తృతంగా ఉపయోగించడం చూడవచ్చు, వీటిలో భాగంగా JPEG సంపీడనం కోసం 8 \times 8 DCT-IIను ఉపయోగిస్తారు లేదా ఆడియో సంపీడనంలో సాధారణంగా చిన్న DCTలు (లేదా MDCTలు)ను ఉపయోగిస్తారు. (పొందుపర్చిన-పరికర అనువర్తనాల కోసం ఒక ప్రత్యేకమైన DCTను ఉపయోగించడానికి కుదించబడిన కోడ్ పరిమాణం కూడా కారణం కావచ్చు.)

వాస్తవానికి, ఒక సాధారణ FFTను ఉపయోగిస్తున్న DCT క్రమసూత్ర పద్ధతులు కూడా కొన్నిసార్లు సహజ-సమరూపక డేటా యొక్క ఒక భారీ FFT నుండి పునరావృత కార్యాచరణల కత్తిరింపు విధానానికి సమానంగా ఉంటుంది మరియు ఇవి అంకాల లెక్క దృష్టికోణం నుండి మరింత ఉత్తమంగా ఉండవచ్చు. ఉదాహరణకు, ఒక రకం-II DCT అనేది సరి-సూచిక అంశాలు శూన్యంగా ఉన్నప్పటికీ, సహజ-సరి సమరూపతతో 4N పరిమాణం యొక్క ఒక DFTకి సమానంగా ఉంటుంది. దీనిని ఒక FFT (ఉదా. FFTPACK మరియు FFTWల్లో ఉపయోగించిన పద్ధతి) ద్వారా లెక్కించే సాధారణ పద్ధతుల్లో ఒకదానిని నరసింహ & పీటర్సన్ (1978) మరియు మాఖోయిల్ (1980)లచే వివరించబడింది మరియు ఈ పద్ధతిలో మీరు DCT IIకి సంబంధిత "తార్కిక" సహజ-సరి DFTకు వర్తింపచేసిన ఒక రాడిక్స్-4 సమయానికి దశాంశ నిర్మూలన కూలే-టుకీ క్రమసూత్ర పద్ధతిలో ఒక దశ వలె అర్థం చేసుకోవచ్చు. ( రాడిక్స్-4 దశ 4N DFT పరిమాణాన్ని సహజ డేటా యొక్క నాలుగు పరిమాణ-N DFTలకు తగ్గిస్తుంది, వీటిలో రెండింటి విలువ సున్నా కాగా, మరో రెండింటి విలువ సరి సమరూపతతో ఒకదానికొకటి సమానంగా ఉంటాయి, కనుక సహజ డేటా యొక్క ఒక ఏక పరిమాణ-N FFTతో పాటు O(N)బట్టర్‌ఫ్లైస్). సరి-సూచిక అంశాలు సున్నా కాబట్టి, ఈ రాడిక్స్-4 దశ అనేది ఖచ్చితంగా ఒక విభజన-రాడిక్స్ దశకు సమానంగా ఉంటుంది; తదుపరి పరిమాణ-N సహజ-డేటా FFT కూడా ఒక సహజ-డేటా విభజన-రాడిక్స్ క్రమసూత్ర పద్ధతిచే (సోరెసెన్ మొదలైన వాటిలో ఉన్నట్లు, 1987) అమలు చేయబడితే, అప్పుడు ఫలిత క్రమసూత్ర పద్ధతి నిజానికి పవర్-ఆఫ్-టూ DCT-II కోసం ప్రచురించబడిన అత్యల్ప అంక లెక్కల్లో పొడవైనదానితో సరిపోలుతుంది (2 N \log_2 N - N + 2 సహజ-అంక గణిత కార్యాచరణలు[1]). కనుక, ఒక అంక గణత లెక్కింపు దృష్ట్యా ఒక FFT ద్వారా DCTని లెక్కించడం గురించి అంతర్గత లోపం ఏదీ లేదు-కొన్నిసార్లు సంబంధిత FFT క్రమసూత్ర పద్ధతి ఉత్తమమైనదో కాదో అనేది ఒక ప్రశ్నగా మారుతుంది. (ఒక ఆచరణ అంశం వలె, ఒక ప్రత్యేక FFT నియమిత కార్యంలో సహాయపడే ఫంక్షన్-కాల్ అనేది చిన్న Nలో ముఖ్యమైన అంశం కావచ్చు, కాని ఇది మడతపెట్టకుండా/వరుసక్రమంలో పరిష్కరించవచ్చు కనుక ఇది ఒక అంక గణిత ప్రశ్న వలె కాకుండా ఒక ఆచరణగా చెప్పవచ్చు.)

గమనికలు[మార్చు]

  1. సహజ అంక గణిత కార్యాచరణల ముఖ్యమైన గణన మరియు ప్రత్యేకంగా సహజ గుణకారాల యొక్క లెక్క అనేవి కొంతవరుకు పరివర్తన వివరణ యొక్క స్థాయిపై ఆధారపడి ఉంటాయి. DCT-II వివరణ కోసం 2 N \log_2 N - N + 2 లెక్క అనేది ఇక్కడ ఇవ్వబడింది; పరివర్తనం మొత్తంగా \sqrt2 కారకంచే కొలవబడినట్లయితే రెండు గుణకారాలు ఆదా అవుతాయి. పరివర్తనం యొక్క అవుట్‌పుట్‌లు JPEGలో ఉపయోగించిన పరిమాణం-8 కేసు కోసం అరాయి మొదలైన వారుచే (1988) వివరించబడిన విధంగా ఒక్కొక్కటిగా మళ్లీ కొలవడానికి అనుమతించబడినట్లయితే, అదనపు గుణకారాలను ఆదా చేయవచ్చు.

సూచనలు[మార్చు]

మూస:Nofootnotes

  • N. అహ్మెద్, T. నటరాజన్ మరియు K. R. రావ్, "డిస్క్రీట్ కొసైన్ ట్రాన్స్‌ఫారమ్", IEEE ట్రాన్స్. కంప్యూటర్స్ , 90-93, జన 1974.
  • N. అహ్మెద్, "హౌ ఐ కేమ్ అప్ విత్ ది డిస్క్రీట్ కొసైన్ ట్రాన్స్‌ఫారమ్", డిజిటల్ సిగ్నల్ ప్రాసెసింగ్ , వాల్యూ. 1, p. 4-5 (1991).
  • W.-H. చెన్, C. H. స్మిత్ మరియు S. ఫ్రాలిక్, “ఎ ఫాస్ట్ కంప్యూటేషనల్ అల్గారిథమ్ ఫర్ ది డిస్క్రీట్ కొసైన్ ట్రాన్స్‌ఫారమ్", IEEE ట్రాన్స్. ఆన్ కమ్యూనికేషన్స్ 25 , 1004–1009, సెప్టె 1977.
  • M. J. నరసింహా మరియు A. M. పీటెర్సన్, "ఆన్ ది కంప్యూటేషన్ ఆఫ్ ది డిస్క్రీట్ కొసైన్ ట్రాన్స్‌ఫారమ్," IEEE ట్రాన్స్. కమ్యూనికే. 26 (6), p. 934–936 (1978).
  • Y. అరాయి, T. అగుయి మరియు M. నాకాజిమా, "ఎ ఫాస్ట్ DCT-SQ స్క్రీమ్ ఫర్ ఇమేజెస్," ట్రాన్స్. IEICE 71 (11), 1095–1097 (1988).
  • P. డుహామెల్ మరియు M. వెట్టెర్లీ, "ఫాస్ట్ ఫోరియర్ ట్రాన్స్‌ఫారమ్స్: ఎ ట్యూటోరియల్ రివ్యూ అండ్ ఎ స్టేట్ ఆఫ్ ది ఆర్ట్," సిగ్నెల్ ప్రాసెసింగ్ 19 , 259–299 (1990).
  • E. ఫెయిగ్, S. వినోగ్రార్డ్. "ఫాస్ట్ అల్గారిథమ్స్ ఫర్ ది డిస్క్రీట్ కొసైన్ ట్రాన్స్‌ఫారమ్," IEEE ట్రాన్సాక్షన్స్ ఆన్ సిగ్నెల్ ప్రాసెసింగ్ 40 (9), 2174-2193 (1992).
  • M. ఫ్రిగో మరియు S. G. జాన్సన్, "ది డిజైన్ అండ్ ఇంప్లెమెంటేషన్ ఆఫ్ FFTW3," ప్రోసీడింగ్స్ ఆఫ్ ది IEEE 93 (2), 216–231 (2005).
  • జాన్ మాఖోయుల్, "ఎ ఫాస్ట్ కొసైన్ ట్రాన్స్‌ఫారమ్ ఇన్ వన్ అండ్ టూ డైమెన్షన్స్," IEEE ట్రాన్స్. అక్యౌస్ట్. స్పీచ్ సిగ్. ప్రోక్. 28 (1), 27-34 (1980).
  • S. A. మార్టుసీ, "సెమిట్రిక్ కాన్వాల్యూషన్ అండ్ ది డిస్క్రీట్ సైన్ అండ్ కొసైన్ ట్రాన్స్‌ఫారమ్స్," IEEE ట్రాన్స్. సిగ్. ప్రాసెసింగ్ SP-42 , 1038-1051 (1994).
  • A. V. ఓపెన్హెయిమ్, R. W. స్కాఫెర్ మరియు J. R. బక్, డిస్క్రీట్-టైమ్ సిగ్నెల్ ప్రాసెసింగ్ , రెండవ సంచిక (ప్రెంటైస్-హాల్, న్యూజెర్సీ, 1999).
  • K. R. రావ్ మరియు P. యిప్, డిస్క్రీట్ కొసైన్ ట్రాన్స్‌ఫారమ్: అల్గారిథమ్స్, అడ్వాంటేజెస్, అప్లికేషన్స్ (అకాడమిక్ ప్రెస్, బోస్టన్, 1990).
  • H. V. సోరెన్సెన్, D. L. జోన్స్, M. T. హెయిడెమాన్ మరియు C. S. బురుస్, "రియల్-వాల్యూడ్ ఫాస్ట్ ఫోరియర్ ట్రాన్స్‌ఫారమ్ అల్గారిథమ్స్," IEEE ట్రాన్స్. అకౌస్ట్. స్పీచ్ సిగ్. ప్రాసెసింగ్ ASSP-35 , 849–863 (1987).
  • H. S. మాల్వార్, సిగ్నెల్ ప్రాసెసింగ్ విత్ ల్యాపెడ్ ట్రాన్స్‌ఫారమ్స్, (ఆర్టెక్ హౌస్, బోస్టన్, 1992).

ఇవి కూడా చూడండి[మార్చు]

బాహ్య లింక్‌లు[మార్చు]

మూస:Compression Methods