Jump to content

శోధన యంత్రాలు

వికీపీడియా నుండి
వెబ్ ఆధారిత ఇమేజ్ సెర్చ్ ఇంజిన్‌లో "చంద్ర గ్రహణం" అనే పదం కోసం చేసిన శోధన ఫలితాలు

శోధన యంత్రం (సెర్చ్ ఇంజిన్) అనేది వెబ్ అన్వేషణలు (ఇంటర్నెట్ అన్వేషణలు ) నిర్వహించడానికి రూపొందించబడిన సాఫ్ట్‌వేర్ వ్యవస్థ, అనగా ప్రశ్నలో పేర్కొన్న నిర్దిష్ట సమాచారం కోసం వరల్డ్ వైడ్ వెబ్‌ను క్రమపద్ధతిలో శోధించడం . శోధన ఫలితాలు సాధారణంగా వరుసలో ప్రదర్శించబడతాయి. ఇవి వెబ్ పేజీలు, చిత్రాలు, వీడియోలు, ఇన్ఫోగ్రాఫిక్స్, వ్యాసాలు, పరిశోధనా పత్రాలు, ఇతర రకాల ఫైళ్ల లింక్‌ల మిశ్రమం కావచ్చు. కొన్ని సెర్చ్ ఇంజన్లు డేటాబేస్ లేదా ఓపెన్ డైరెక్టరీలలో లభించే డేటాను శోధిస్తాయి . మానవ సంపాదకులు మాత్రమే నిర్వహించే వెబ్ డైరెక్టరీల మాదిరిగా కాకుండా, సెర్చ్ ఇంజన్లు వెబ్ క్రాలర్‌లో అల్గోరిథంను అమలు చేయడం ద్వారా ఎప్పటికప్పుడు తాజా సమాచారం సేకరణను చేస్తాయి. వెబ్ సెర్చ్ ఇంజిన్ ద్వారా శోధించలేని ఇంటర్నెట్ విషయాలను సాధారణంగా లోతైన వెబ్ (డీప్ వెబ్) అని అంటారు.

శోధన యంత్రాలు ఎలా పని చేస్తాయి?

[మార్చు]

శోధన యంత్రాలు ఎలా పని చేస్తాయి? మనం అడిగిన ప్రశ్నకి అంత వేగంగా సమాధానం ఎలా తెలుసుకుంటాయి?

ఈ ప్రశ్నలకి సమాధానం చదివే ముందు పాఠకులకి అంతర్జాలం (Internet) అంటే ఏమిటో, విశ్వవ్యాప్తవ్యూహం (World Wide Web) అంటే ఏమిటో కనీసపు అవగాహన ఉండాలి. అది లేని వారు ముందుగా ఆ అవగాహన సమకూర్చుకొండి.

శోధన యంత్రాలు చాలా ఉన్నాయి ( జాబితా (ఆంగ్ల వికీవ్యాసం)). వాటిలో మిక్కిలి ప్రాచుర్యం ఉన్నది గూగుల్ శోధన యంత్రం. [1] శోధన అనేది మనందరికి దైనందిన వ్యవహారలలో పరిచయం ఉన్న ప్రక్రియే అయినప్పటికీ దీనిని కంప్యూటర్ల మీద అమలు చేసినప్పుడు ఒక అద్భుతమైన ప్రక్రియగా పరిణమించింది. మనం కంప్యూటర్ దగ్గరకి వెళ్ళి ఏదైనా ఒక ప్రశ్న అడగడానికి ముందే మనం అడగబోయే ప్రశ్నకి సమాధానం వెతకడానికి శోధన యంత్రం సంసిద్ధంగా ఉంటుంది. ఇది ఎలా జరుగుతుందో చిన్న ఉపమానం ద్వారా చూద్దాం.

పెరట్లో మొక్కలు నాటాలని ఉందనుకుందాం. ఏయే మొక్కలు మన వాతావరణంలో బాగా పెరుగుతాయి? ఏ రకం నేలలో ఏవి ఏపుగా పెరుగుతాయి? వేటికి ఏ ఎరువులు వెయ్యాలి? వాటి సంరక్షణ ఎలా చెయ్యాలి? వగైరా ప్రశ్నలు పుట్టుకొస్తాయి కదా! వీటికి సమాధానాలు కావాలంటే ఒకటో, రెండో పుస్తకాలు సంప్రదించవలసి ఉంటుంది. అందుకని గ్రంథాలయానికి వెళతాము.

మరొక వ్యక్తికి పశువుల పెంపకం మీద ఆసక్తితో అదే గ్రంథాలయానికి వస్తాడు నిజానికి ఆ గ్రంథాలయానికి ప్రతి రోజు వందలకొద్దీ మనుష్యులు ఏదో ఒక అంశం వెతుక్కోడానికి వస్తారు. అక్కడ పుస్తకాలన్నీ ఒక పోగులా పోసి, “వెతుక్కోండర్రా!” అంటే కుదురుతుందా? ఎవరికి ఎప్పుడు ఏది కావాలో ముందుగా తెలియదు కనుక ఆ గ్రంథాలయం నడిపే వ్యక్తులు వాళ్ళ దగ్గర ఉన్న పుస్తకాలన్నిటిని ఒక క్రమ పద్ధతిలో బీరువాలలో అమర్చి పెడతారు. ఏ బీరువాలో ఏ పుస్తకాలు ఉన్నాయో ఒక "కేటలాగు"లో రాసి పెట్టుకుంటారు. ఒకరు మొక్కల గురించి వాకబు చేస్తే, ఆ కేటలాగుని సంప్రదించి, “ఫలానా బీరువాలో ఫలానా అరలో చూడండి" అని వారు చెబితే అక్కడకి వెళ్ళి ఆ పుస్తకం తీసుకుంటారు. కదా?

మనకి కావలసిన పుస్తకం మన ఊరి గ్రంథాలయంలో లేకపోతే? అప్పుడు గ్రంథాలయం అధికారులు జిల్లాలోనో, రాష్ట్రంలోనో ఉన్న అన్ని గ్రంథాలయాలలోనూ ఏయే పుస్తకాలు ఎక్కెడెక్కడ ఉన్నాయో చూపే "పేద్ద" చిట్టా తెరచి మనకి కావల్సిన పుస్తకం ఎక్కడ దొరుకుతుందో వెతికి, అది తెప్పించి ఇస్తారు. శోధన యంత్రాలు అన్నీ దాదాపు ఇదే బాణీలో పని చేస్తాయి.

ఉదాహరణకి మనకి “బేటరీ” ల గురించి తెలుసుకోవాలన్న కుతూహలం పుట్టిందనుకుందాం. కంప్యూటర్లో వీక్షణి (browser) తెరచి అందులో నిర్దేశించిన ప్రదేశంలో “బేటరీలు” అని రాశామనుకుందాం. అప్పుడు మన కంప్యూటరు లక్షలు, కోట్లకొద్దీ జాలస్థలి (website)ల దగ్గరకి వెళ్ళి అక్కడ “బేటరీ” అనే మాట ఉందేమో వెతకాలి. ఈ వెతుకులాట జరగడానికి కేవలం లిప్త మాత్రపు కాలం పడుతుందని మనకి అనుభవం మీద తెలుసు. ఎందుకంటే మనం ప్రశ్న అడిగిన ఉత్తర క్షణంలో మనకి తెర మీద నాలుగో, అయిదో లంకెలు చూపించి ఆ లంకెల దగ్గర మనకి కావలసిన సమాచారం ఉందని శోధన యంత్రం చెబుతుంది. కోట్ల జాలస్థలులు వెతికినప్పుడు ఏయే లంకెలలో మనకి బాగా ఉపయోగపడే సమాచారం ఉందో శోధన యంత్రానికి ఎలా తెలుస్తుంది? ఈ శోధన అంతా లిప్త మాత్రపు కాలంలో ఎలా జరుగుతుంది? ఈ కిటుకు అర్థం అవాలంటే కొంచెం అవగాహన అవసరం. వాలు కుర్చీలో వెనక్కి జేరబడి చుట్ట కాలుస్తూ “నాకు బోధ పడేలా చెప్పండి!” అంటే సాధ్యం కాదు. కాని ఒక నఖచిత్రంలా టూకీగా ఈ ప్రక్రియని పరిశీలిద్దాం.

పాకురాలు (Crawlers)

[మార్చు]

ఒక ఆసామీ కంప్యూటరు దగ్గర కూర్చుని ప్రశ్న వెయ్యడానికి ముందే కంప్యూటరు తన ప్రయత్నం మొదలు పెడుతుంది. శోధనకి ఒక శోధన సూచి (Search index) అవసరం. ఇది గ్రంథాలయంలో “కేటలాగు” లాంటిది. ప్రపంచ వ్యాప్తంగా ఉన్న అన్ని జాలస్థలా (websites)లలో ఉన్న సమాచారం అంతటిని సేకరించి, ఏయే జాలస్థలాలలో ఏ సమాచారం ఉందో తెలుసుకోడానికి వీలుగా శోధన యంత్రం ఒక పేద్ద శోధన సూచి ని తయారు చేస్తుంది. ఇది తయారయిన తరువాత దానిని నిరంతరం తాజీకరిస్తూ (update చేస్తూ) ఉంటుంది. ఈ తాజీకరణ ప్రక్రియ నిరంతరం, 24 గంటలూ, ఏడు రోజులూ, అలా నేపథ్యంలో జరుగుతూనే ఉంటుంది. ఈ పని చెయ్యడానికి - అనగా ప్రపంచంలో నలుమూలలా ఉన్న అన్ని జాలస్థలులని పరీక్షించి, సమీక్షించడానికి - కోటాను కోట్ల “పాకాడులు” (crawlers) ని శోధన యంత్రం పంపుతుంది. ఇవి సేకరించిన సమాచారాన్ని క్రోడీకరించి, ఒక వరుసక్రమంలో అమర్చి, ఏ క్షణానికి ఆక్షణం ఆ శోధన సూచికని “తాజీకరిస్తూ” ఉంటారు. (ఈ ప్రక్రియ ఎలా సాధిస్తారో తెలుసుకోవాలంటే బాగా లోతుగా శాస్త్రం అధ్యయనం చెయ్యాలి. [2])

మన ఆసామీ “బేటరీ” గురించి ప్రశ్న అడగగానే శోధన యంత్రం ముందుగా కోటానుకోట్ల అంశాలు ఉన్న ఈ సూచికలో వెతుకుతుంది. ఇది లిప్త కాలప్రమాణంలో జరిగిపోతుంది. (ఇది ఎలా సాధ్యం అన్న అనుమానం వస్తే మళ్ళా ఇందాకటి సమాధానమే! బాగా లోతుగా శాస్త్రం అధ్యయనం చెయ్యాలి!)

తరువాత చెయ్యవలసినది ఏమిటి? సూచిని వెతకగా లభించిన సమాచారాన్ని వినియోగదారులకి ఎక్కువ ఉపయోగపడే పద్ధతిలో తెర మీద ప్రదర్శించడం. ఉదాహరణకి ఒక చోటు నుండి మరొక చోటుకి ప్రయాణం చేసేటప్పుడు దారి కావాలని అడిగితే సమాధానం “పటం” (map) రూపంలో చూపెడుతుంది. బేటరీలని ఎలా తయారు చేస్తారో తెలుసుకోవాలంటే ఆ సమాచారం ఎక్కడ దొరుకుతుందో ఆ జాలస్థలి విలాసం (address) కి లంకె (link) చూపుతుంది. పిల్లలని నిద్రపుచ్చడానికి జోల పాట కావాలంటే ఆ పాట దొరికే “విడియో” కి లంకె ఇస్తుంది. దొరికిన సమాచారం ఏ విధంగా “చూపిస్తే” వినియోగదారులకి ఎక్కువ ఉపయోగమో “గ్రహించి” ఆ విధంగా చూపెడుతుంది. (ఇది ఎలా చేస్తారన్న అనుమానం వస్తే మళ్ళా ఇందాకటి సమాధానమే! బాగా లోతుగా శాస్త్రం అధ్యయనం చెయ్యాలి!)

మూలాలు

[మార్చు]
  1. "గూగుల్ శోధన యంత్ర జాలస్థలి". Retrieved 2021-02-08.
  2. https://www.educative.io/courses/grokking-the-system-design-interview/NE5LpPrWrKv[permanent dead link]

వెలుపలి లంకెలు

[మార్చు]