వికీపీడియా:గూగుల్ అనువాద వ్యాసాలు

వికీపీడియా నుండి

ఈ పేజీలో గూగుల్ ట్రాన్స్లేటర్ టూల్కిట్ గూగుల్ అనువాద పరికరంతో నేరుగా ఎక్కించిన వ్యాసాలకు సంబంధించిన విధి విధానాలు, తీసుకోవలసిన చర్యలు, సూచనలు మొదలగు కొన్ని మార్గదర్శకాలు చర్చించబడతాయి. ఎవరైనా ఇక్కడ కొత్త సూచనలు, చర్చలు చేయవచ్చు. ఏకపక్షంగా గూగుల్ ఈ ప్రాజెక్టుని ప్రారంభించి దాదాపు 900 పైగా వ్యాసాలు చేర్చి తరువాత ఆపివేసింది.

విషయ సూచిక

[మార్చు] సమస్య పరిచయం

ప్రసిద్ధ శోధనా యంత్రపు కంపెనీ గూగుల్ యాంత్రిక అనువాద పరికరం "గూగుల్ ట్రాన్స్‌లేట్" ను ఆవిష్కరించింది. అయితే ఈ ఆన్లైను పరికరం కొన్ని భాషలకే ఎంతోకొంత నాణ్యమైన అనువాదాలు చేయగలదు. ఇలా ఏ భాషలకు నాణ్యతగా పనిచేస్తుందన్న విషయం ఆయా భాషలకు లభ్యమౌతున్న అనువాద గ్లాసరీలు, పదకోశాలను అనుసరించి ఉంటుంది. మిగిలిన భాషలన్నింటికీ యాంత్రిక అనువాదం అభివృద్ధి చెయ్యాలంటే కొంత యంత్రానికి తర్ఫీదు ఇవ్వగల నాణ్యమైన అనువాద పాఠ్యాలు ఉండాలి, అంతేకాక విస్తృతమైన అనువాద గ్లాసరీలు తయారు చెయ్యాలి. దీన్ని సాధించడానికి గూగుల్ ఒక ట్రాన్స్‌లేటర్ టూల్ కిట్ అనే పనిముట్టును తయారుచేసి క్రౌడ్‌సోర్సింగ్ (మందకు అప్పజెప్పడం) అనే విన్నూత ప్రక్రియను అవలభించింది. ఇది ఇరుపక్షాలకి లాభించే సర్దుబాటే. ఈ పరికరాన్ని ఉపయోగించి అనువాదాలు చేసిన పాఠ్యం ఆయా భాషల్లో అనువాద గ్లాసరీలు అభివృద్ధి చెందడానికి, ఈ అనువాద పాఠ్యం ఉపయోగించి యాంత్రిక అనువాదాన్ని మరింత మెరుగుపరచడానికి ఉపయోగపడతాయి. అలాగే ఆ భాషల్లో అనువాదాలు చేసేవారికి రాను రాను యాంత్రిక అనువాదం మెరుగౌతుండం.


గూగుల్ ఒక ట్రాన్స్‌లేటర్ టూల్ కిట్ అనువాద గ్లాసరీల అభివృద్ధికి మూల పాఠ్యంగా వికీపీడియాను ప్రోత్సహిస్తుంది. అందువల్ల అది ఏదైనా ఒక ఆంగ్ల వికీపీడియా వ్యాసాన్ని ఎంపిక చేసుకొని, దాన్ని కావలసిన భాషలోకి తర్జుమా చేసి, నేరుగా ఆ పరికరంలో నుండే ఆయా ప్రాంతీయ భాషా వికీలోకి ఎక్కించే సదుపాయం కల్పించింది. దీనిని ఉపయోగించి కొంతమంది ఔత్సాహికులు మరియు కొంతమంది ప్రతిఫలం ఆశించి పనిచేసేవారు (గూగుల్ ప్రాజెక్టు) ఆంగ్ల వికీ వ్యాసాలను తెలుగులోకి తర్జుమా చేసి, క్రమం తప్పకుండా అనేక పెద్ద వ్యాసాలను తెవికీలో నేరుగా చేర్చుతున్నారు.

[మార్చు] గూగుల్ వారి వివరణ

వికీమేనియా 2010 (జులై 9-11) లో గూగుల్ ప్రతినిధి ఈ ప్రాజెక్టు పై ప్రసంగించారు.46 శాతం వికీపీడియా పేజీ వీక్షణలు గూగుల్ ద్వారా జరుగుతున్నాయి. గూగుల్ తన లక్ష్య సాధనకు (సమగ్ర సమాచారాన్ని ప్రజలకు అందుబాటులో చేయటం) వికీపీడియాలో విషయాలను పెంచటానికి గూగుల్ అనువాద పరికరం తయారు చేశారు. సాధారణ అనువాద పద్దతులలో వాక్య విశ్లేషణ ఆధారంగా జరుగుతుంది. దీనికి భిన్నంగా, రెండుభాషలలోని, మూల వ్యాసం, అనువాద వ్యాసాలలో పదాల, వ్యాసాల జతల జాబితా ఆధారంగా ఈ అనువాద పద్ధతి పనిచేస్తుంది. ఈ జాబితా ఎంత పెద్దదైతే అనువాదం అంత మెరుగుగా వుంటుంది.

ఈ పరికరం సహాయంతో పదానికి పదం, పదబంధానికి పదబంధం యాంత్రికంగా అనువదిస్తుంది, ఆ తరువాత అనువాదకుడు దీనిని మెరుగు (కొత్త పదాలు లేక పదబంధాలు లేక వాక్య నిర్మాణం సరిచేయటం చేస్తాడు. మానవ సహాయం శాతం రూపంలో ఇవ్వబడుతుంది. దీనిని ఆధారంగా ముద్రించాల లేదా అన్న నిర్ణయం తీసుకోవచ్చు.

గూగుల్ అనువాదం పరికరం ద్వారా 2500 భాష జతలు పూర్తి యాంత్రికంగా, 100000భాష జతలు మానవ సహాయంతో అనువాదం చేయవచ్చు. పాశ్చాత్య భాషలలో అనువాద కార్పస్ ఎక్కువగా (ఐక్యరాజ్య సమితిలో పత్రాలను అన్ని అధికారిక భాషలలో వున్నాయి), భారతీయ భాషలలో దీనిని పెంచడానికి ఆగష్టు 2008 లో హిందీతో మొదటి ప్రయోగం జరిగింది. వికీమీడియా ఫౌండేషన్ సహకారంతో హిందీ వికీపీడియన్లని సంప్రదించారు. 100 కి పైగా వ్యాసాలను అనువదించారు. ఇది సత్ఫలితాలనిచ్చింది. అనువాద వ్యాసాలను శోధనాయంత్రాలలో వాడిన పదాల ప్రాధాన్యతల ఆధారంగా ఎంపిక చేశారు. 60 శాతం అనువాద వ్యాసాలు, శోధించిన వ్యాసాలలో మొదటి స్థానంలో, 80 శాతం వ్యాసాలు మొదటి ఐదు స్థానాలలో వున్నాయి.

ఆ తరువాత అరబిక్, ఇండిక్ (తమిళం, తెలుగు, బెంగాలి..)స్వాహిలి భాషలలో ప్రయోగాలు జరుగుతున్నాయి. అరబిక్ లో ఔత్సాహికులు, నగదు కోసం పనిచేసే అనువాదకులు పనిచేశారు. 1000 పైగా వ్యాసాలు (5మిలియన్ పదాలు)చేర్చగా 20 శాతం వ్యాసాలు తిరస్కరించబడ్డాయి. స్వాహిల్ లో పోటీల ద్వారా నిర్వహించారు. 800 మంది నమోదు చేయగా, 100 మంది క్రియాశీలంగా వున్నారు.

ఇండిక్ భాషలలో 10 మిలియన్ పదాలతో, 1000 కి పైగా వ్యాసాలను చేర్చారు. తమిళం లో 3 మిలియన్ పదాలు (మొత్తం వికీ 6.5 మిలియన్ పదాలు), తెలుగులో 1.55 మిలియన్ పదాలు చేర్చారు.0.7మిలియన్ పదాల చేర్చిన తరువాత బెంగాలి భాష వారుదీనిని తిరస్కరించారు. జూన్ 2009 లో ప్రజలకు విడుదల చేశారు.

గూగుల్.ఆర్గ్

గూగుల్.ఆర్గ్ (ఇప్పటి వరకు చేసిన గూగుల్.కాం వారికి భిన్నంగా) పరిసరాలు, శక్తి, ఆరోగ్యం రంగాలలో వ్యాసాల సంఖ్యను గణనీయంగా పెంచడానికి పూర్తిగా ఔత్సాహికుల విధానంలో(గూగుల్ మాప్ మేకర్ పద్ధతి) నిర్వహిస్తున్నారు.

గూగుల్ వారికి ఎదురైన ఇబ్బందులు
  • కుడి నుండి ఎడమకు రాయు భాషలు(RTL), స్థలకేటాయింపు పదాలు(placeholder), లింకులు
  • వాక్యానుగత అనువాదం
  • మూసలు అనువాదన చేయబోయే భాషలో వుండకపోవడం
  • వికీపీడియా లో నేరుగా ముద్రణ చేయడం లేక మునుజూపు ముద్రణ.

[మార్చు] తమిళ వికీ వారి స్పందనలు

తమిళ వికీపీడియన్ రవిశంకర్ తయారుచేసిన ప్రసంగాన్ని [1] మయూరనాథన్ వికీమేనియాలో వ్యక్తీకరించారు. దానిలో మఖ్యవిషయాలు. మార్చి 2009 లో గూగుల్ అనువాద పని గోప్యంగా ప్రారంభమైంది. ఫిభ్రవరి 2010 లో గూగుల్ తో సమన్వయం మొదలైంది.

సాంకేతిక సమస్యలు
  • అత్యధిక ఎరుపు లింకులు
  • మూసలు దిగుమతి చేయటం లేదు
  • బొమ్మలు దిగుమతి చేయటం లేదు.
  • గూగుల్ అనువాద పరికరం వాడుకరికి సౌలభ్య లోపాలు.
నిర్వహణ సమస్యలు
  • వ్యాసాల ఎంపిక భారత దేశంలో ఇంగ్లీషు శోధన పదాల ప్రాధాన్యంగా జరిగింది. అందువలన అమెరికన్ పాప్ గాయనీగాయకుల వ్యాసాలు అనువాదం తమిళ భాష వారికి ఉపయోగంలేదు.
  • ఇప్పటికే వున్న వ్యాసాల తొలగించి వాటి స్థానంలో అనువాద వ్యాసాలు స్థాపించబడుట
  • అనువాదకులు ఒక ఖాతా ద్వారా పని చేశారు.
  • ఔత్సాహిక వికీపీడియన్ల స్పందనల సమయం, నగదు ప్రతిఫలం అనువాదకులు ఆకాంక్షకి సరిపోలేదు.
  • 15 పైగా అనువాదకులు వివిధ అనువాద సంస్థల ద్వారా పనిచేస్తున్నారు.సమన్వయంలో లోపాలు ఏర్పడుతున్నాయి.
వికీపీడియా తత్వ సమస్యలు
  • నగదు పని చేసే అనువాదకులకు/వికీపీడియన్లు (గూగుల్) వలన, సాధారణ వికీపీడియన్లలో ఆసక్తి తగ్గిపోతున్నది
  • స్వల్పకాలికంగా ఉపాధి కల్పించబడుతున్నది. దీర్ఘకాలికంగా దీని ఫలితాలు ఎలా వుంటాయో తెలియదు.
గూగుల్ తో సంప్రదింపుల ఫలితాలు
  • అనువాద వ్యాసాల శుద్ధి అనువాదకులే చేయాలి
  • గూగుల్ అనువాద సభ్యులు, గూగుల్ అనువాద వ్యాసాల వర్గాలు గూగుల్ అనువాదకులు వాడాలి
  • అనువాదకులు వ్యక్తిగత ఖాతాలో వికీలో పనిచేయాలి

[మార్చు] తెవికీ అనుభవాలు

  • ఈ అనువాదాలు చేస్తున్న సభ్యులెవరూ, తెవికీ లో అనుభవంగలవారు కాదు.
  • చాలా మటుకు ఈ అనువాదాలు మానవ సహాయంతో చేస్తున్నా, కొన్ని వాక్య నిర్మాణాలు, పదాల ఎంపిక అంత సహజంగా ఉండటం లేదు.
  • అప్పటికే ఉన్న వ్యాసాలను బేఖాతరు చేస్తూ ఈ అనువాదకులు కొత్త వ్యాసాలను పాతవాటిపై రాస్తున్నారు. దీని గురించి తెవికీ సభ్యులు కొంత ఆందోళన వ్యక్తం చేశారు. "యాంత్రిక అనువాదాలను అడ్డుకోవాలి" అనే అభిప్రాయం నుండి "పెద్ద ఆందోళన చెందాల్సిన అవసరం లేదు" వరకు అనేక భిన్నమైన అభిప్రాయాలు వెలువడ్డాయి.
  • ఈ వ్యాసాల వల్ల తెవికీలో అతి వేగంగా విస్తృతమైన విషయాలపై పెద్ద పెద్ద వ్యాసాలు సమకూరుతున్నాయి.
  • ఈ అనువాదాలు కొంత వరకు కృత్తిమంగా ఉండటం వలన వాటిని సహజంగా తయారు చెయ్యటానికి కొంత వికీ సభ్యుల ప్రయత్నం అవసరం

[మార్చు] గూగుల్ తో సంప్రదింపుకోసం సూచనలు

  • తమిళ వికీ వారి సూచనలను తెలుగు వికీ అనువాదాలకు వర్తించడం
  • గూగుల్ తో జులై 2010 లో బెంగుళూరు లో జరిగిన సమావేశంలో తమిళ ప్రతినిధితో పాటు అర్జున పాల్గొన్నారు. అనువాద విధానాలు మెరుగు చేయటం గురించి చర్చ జరిగింది. అవి తమిళంలో అమలు ఐన తర్వాత, తెలుగుకు అమలుచేస్తామన్నారు. గూగుల్ తో ఈ విషయానికి సంబంధించి పనిచేయటానికి అసక్తిగల వారు గూగుల్ నిర్వహించే ప్రత్యేక మెయిలింగ్ లిస్టులో సభ్యత్వానికి అర్జున ని సంప్రందించగలరు.

[మార్చు] గూగుల్ యాంత్రిక అనువాదాల పథకం -సముదాయ స్పందన

గూగుల్ పథకం ద్వారా ఇప్పటికి అనువాదం చేయబడిన, లేక అనువాదానికి ప్రతిపాదించిన వ్యాసాల జాబితా ఇతర వివరాలు తెలుగువికీ గూగుల్ గుంపు సభ్యులకు పంచబడినది. http://groups.google.com/group/teluguwiki/browse_thread/thread/50f4dae9d0fd6f1f. స్పందన ఈ నెలాఖరులోగా తెలపమని కోరుతున్నాను. తమిళ వికీ వారి అనుభవం ప్రకారం మార్చిన విధానం (http://lists.wikimedia.org/pipermail/wikimediaindia-l/2010-December/001376.html) పై కూడా స్పందనలు ఈ ప్రాజెక్టు చర్చా పేజీలో తెలపండి. చర్చలకు సంబంధిత తెవికీ ఫేస్బుకు సరణి లో (http://www.facebook.com/#!/home.php?sk=group_166361376723388&ap=1) అయిన వాడవచ్చు. -- అర్జున 12:29, 13 డిసెంబర్ 2010 (UTC)

నేరుగా ఆన్లైన్ లో మార్పులు చేయటానికి ఈ లింకు వాడండి. ముఖ్యంగా ఇప్పటి వరకు చేసిన వ్యాసాల నాణ్యత నిర్ణయం, కావలసిన కొత్త వ్యాసాలను గుర్తించితే బాగుంటుంది. https://spreadsheets.google.com/ccc?key=0AtVHTVzubonwdGJIMGhvWGpWN0dNdGtQU3M2TzNPUmc&hl=en#gid=0

[మార్చు] యాంత్రిక అనువాద వ్యాసాల సంస్కరణ

  • ఒక పదం వున్న ఎర్రలింకులను తొలగించటానికి వికీ ఎడిటర్ లో వెతుకు మరియ పునస్థాపించు (Search and Replace లో) వాడవలసిన రెగ్యులర్ ఎక్స్ప్రెషన్ వివరాలు

వెతుకుటకు: \[\[([^\]]*)]] పునస్థాపించు: $1 Treat search string as regular expression ను చెక్ చేయాలి, ఒక్కొక్క దానిని వెతుకుతు అవసరమైతే మారుస్తూ పోవాలి.

[మార్చు] ఇవీ చూడండి

[మార్చు] వనరులు

  1. A Review on Google Translation project in Tamil
వ్యక్తిగత పరికరాలు
నేంస్పేసులు

వైవిధ్యాలు
పేజీకి సంభందించిన లింకులు
చర్యలు
మార్గదర్శకము
పరస్పరక్రియ
పరికరాల పెట్టె