సరికొత్త కెరీర్.. కంప్యుటేషనల్ లింగ్విస్టిక్స్
Sakshi Education
కంప్యూటర్/ ఇంటర్నెట్ వినియోగం ఊహించని స్థాయికి చేరుకుంటున్న ప్రస్తుత దశలో.. స్థానిక భాషలకనుగుణంగా సాఫ్ట్వేర్లను రూపొందించడం.. వెబ్సైట్లోని సమాచారాన్ని ఒకే ఆప్షన్ ద్వారా వేరొక భాషలోకి తర్జుమా చేయడం దిశగా నూతన సాంకేతిక విప్లవం సాగుతోంది.. భాషకు, టెక్నాలజీకి మధ్య గ్యాప్ను పూడ్చే వారధిగా ఉద్భవిస్తున్న విభాగం.. కంప్యుటేషనల్ లింగ్విస్టిక్స్.. మ్యాన్- మెషిన్ పరస్పర వ్యవస్థలో ఒక మైలు రాయిగా.. సరికొత్త కెరీర్ అవెన్యూగా నిలుస్తోంది.. ఈ నేపథ్యంలో కెరీర్గా కంప్యుటేషనల్ లింగ్విస్టిక్స్ సంబంధిత వివరాలపై ఫోకస్..
ఒకప్పుడు కంప్యూటర్, సెల్ఫోన్లలో కేవలం ఇంగ్లిష్ భాషను మాత్రమే వినియోగించే వారు. కానీ ప్రస్తుత మార్కెటింగ్ యుగంలో వినియోగదారులకు మెరుగైన సేవలు అందించే ఉద్దేశంతో ఇంటర్నెట్ నుంచి మన ఇంటి పక్క కనిపించే ఏటీఎం వరకు అన్ని సాఫ్ట్వేర్ ఆధారిత సేవల్లో స్థానిక భాషల వినియోగం పెరిగింది. ఆన్లైన్ వెబ్ డిక్షనరీలు, వెబ్సైట్లోని సమాచారం మరొక భాషలోకి ఆటోమేటిక్గా తర్జుమా వంటి ప్రక్రియలో స్థానిక భాష ఉపయోగం నిర్విరామంగా సాగుతోంది.
జోరుగా:
విప్లవంలా సాగుతున్న ఇంటర్నెట్ వినియోగం కేవలం ఇంగ్లిష్ భాషకు మాత్రమే పరిమితం కాలేదు. ఇంటర్నెట్ వినియోగాన్ని మరింత సులభతరం చేసే ఉద్దేశంతో ఆయా దేశాలను బట్టి స్థానిక భాషల వినియోగానికి ఇంటర్నెట్ సెర్చ్ ఇంజిన్స్, సాఫ్ట్వేర్ ఆధారిత సేవలు అందించే వెబ్సైట్స్ అధిక ప్రాధాన్యతనిస్తున్నాయి. ఉదాహరణకు ఫేస్బుక్, జీమెయిల్ లేదా ఇతర మాధ్యమాల్లో ఇంగ్లిష్లో టైప్ చేస్తున్న పదాలు అదే సమాన అర్థంతో తెలుగులో ప్రత్యక్షమవ్వడం (ఉదాహరణకు-comeకమ్) వంటివి. ఈ నేపథ్యంలో ఇంటర్నెట్ను ఆయా స్థానిక భాషలకనుగుణంగా మలిచే ప్రక్రియ జోరుగా కొనసాగుతోంది. దాంతో భాష, కంప్యూటర్ ప్రోగ్రామింగ్ పట్ల అవగాహన ఉన్న వారికి సరికొత్త వేదికగా నిలుస్తోంది.. కంప్యుటేషనల్ లింగ్విస్టిక్స్. మనిషి మాట్లాడే, రాసే ప్రక్రియలో ఉపయోగించే భాష, కంప్యూటర్ల మధ్య సంబంధాన్ని అవగాహన చేసుకోవడం ద్వారా ఒక కంప్యూటర్ భాషను రూపొందించడమే కంప్యుటేషనల్ లింగ్విస్టిక్స్.
ప్రక్రియులు ఎన్నో:
కంప్యుటేషనల్ లింగ్విస్టిక్స్లో ఎన్నో ప్రక్రియలు ఉంటాయి. అవి.. వివిధ భాషల్లోని డాక్యుమెంట్ల అనువాదం, స్వరాన్ని గుర్తించే (voice recognition) సాఫ్ట్వేర్ను రూపొందించడం, ఆటోమేటెడ్ ఈ-మెయిల్, డేటా మైనింగ్ వంటివి. ఇందులో వాయిస్ జీపీఎస్, గూగుల్ ట్రాన్స్లేటర్, భాషకు సంబంధించిన ఇతర సాంకేతిక అంశాలు ఇమిడి ఉంటాయి. అంతేకాకుండా మెషిన్ ట్రాన్స్లేషన్, నేచురల్ లాంగ్వేజ్ ఇంటర్ఫేసెస్, గ్రామర్ అండ్ స్టైల్ చెకింగ్, డాక్యుమెంట్ ప్రాసెసింగ్-ఇన్ఫర్మేషన్ రిట్రివల్, కంప్యూటర్ అసిస్టెడ్ లాంగ్వేజ్ లెర్నింగ్ వంటి ప్రక్రియలు ఉంటాయి. కంప్యుటేషనల్ లింగ్విస్టిక్స్లో ఫిలాసఫీ, సైకాలజీ వంటి అంశాలు కూడా కొంత వరకు ఇమిడి ఉంటాయి. సంబంధిత సాఫ్ట్వేర్ను అభివృద్ధి చేసే క్రమంలో కంప్యూటర్ నిపుణులు, సైకాలజిస్ట్స్, మ్యాథమెటీషియన్స్, భాషా వేత్తలు (లాంగ్వేజ్ ఎక్స్పర్ట్స్) కలిసి పని చేస్తారు. కంప్యుటేషనల్ లింగ్విస్టిక్స్ నిపుణులు నిర్వహించే విధులను బట్టి ఈ రంగంలో సాధారణంగా రెండు విభాగాలు ఉంటాయి. అవి.. అప్లయిడ్ లింగ్విస్టిక్స్, థియరిటికల్ లింగ్విస్టిక్స్.
థియరిటికల్ లింగ్విస్టిక్స్:
ఇందులో భాష, అభిజ్ఞా వికాసానికి (cognitive science) సంబంధించిన సిద్ధాంతాలపై లింగ్విస్టిక్ నిపుణులు పని చేస్తారు. అంటే భాషకు సంబంధించిన అంశాలను మానసిక దృక్పథం (psycholinguistics)తో అవగాహన చేసుకునే ప్రక్రియ ఇక్కడ సాగుతుంది. తద్వారా మానవుడు ఉపయోగించే భాషను పకడ్బందీగా అవగాహన చేసుకునే సాఫ్ట్వేర్ను అభివృద్ధి చేసే అవకాశం చిక్కుతుంది. ఇందులో సాంకేతిక అంశాల కంటే భాషాపరమైన అంశాలపై ఎక్కువగా దృష్టి ఉంటుంది.
అప్లైడ్ లింగ్విస్టిక్స్:
ఇందులో సాంకేతిక అంశాలు అధికంగా ఉంటాయి. ఈ క్రమంలో అవుట్కమ్ రూపంలో వచ్చే భాషకు ఒక రూపాన్నిస్తారు. ఒక రకంగా చెప్పాలంటే మానవ భాష పట్ల కొంత అవగాహన ఉన్న సాఫ్ట్వేర్ను అభివృద్ధి చేస్తారు. ఈ క్రమంలోటెక్ట్స్-టు-స్పీచ్ టెక్నాలజీ, స్పీచ్-టు-టెక్ట్స్ వంటి సాంకేతిక అంశాలపై పని చేస్తారు. టెక్ట్స్-టు-స్పీచ్లో భాగంగా మానవుడు ఇచ్చిన నిర్దేశాన్ని కంప్యూటర్ అవగాహన చేసుకుంటుంది (ఈ నిర్దేశం ప్రశ్న రూపంలో ఉంటుంది.
ఈ ప్రక్రియలో ప్రశ్నను టైప్ చేయడం లేదా మాట్లాడడం ద్వారా మానవ భాషలో కంప్యూటర్కు అందిస్తాము). స్పీచ్-టు-టెక్ట్స్ విభాగంలో మానవ భాష నుంచి మెషీన్ అర్థం చేసుకునే టెక్ట్స్ను రూపొందిస్తారు. అంతేకాకుండా ఆటోమేటిక్ మెషిన్ ట్రాన్స్లేషన్ ప్రక్రియ ద్వారా వివిధ భాషల్లో అనువాద ప్రక్రియను అభివృద్ధి చేస్తారు. సెర్చ్ ఇంజిన్కు సంబంధించిన ఇంటెలిజెంట్ వ్యవస్థను కూడా ఈ ప్రక్రియ ద్వారానే రూపొందిస్తారు.
విధులు-విభాగాలు:
ఇంటర్నెట్, మొబైల్ వంటి మాధ్యమాల్లో ఉపయోగించే వివిధ భాషలకు సంబంధించిన ప్రక్రియలను సులభతరం చేసే విధులను కంప్యుటేషనల్ లింగ్విస్టిక్స్ నిపుణులు నిర్వహిస్తుంటారు. ఈ క్రమంలో యాంత్రిక పద్ధతిలో భాషా శాస్త్ర నియమాలను దృష్టిలో పెట్టుకుని పద కోశాన్ని రూపొందించడం, వివిధ భాషా ప్రక్రియలను సులభతరం చేయడం, సంబంధిత సాఫ్ట్వేర్, ప్లాట్ఫామ్లను రూపొందించే అంశాలపై పని చేస్తుంటారు. కంప్యూటర్ ప్రోగ్రామ్లో ఉపయోగించే భాషా శాస్త్ర ప్రక్రియలను కంప్యూటర్ లింగ్విస్టిక్స్ నిపుణులు రూపొందిస్తారు. ఇందులో ఎన్నో విభాగాలు ఉంటాయి. ఈ క్రమంలో స్పీచ్ రికగ్నైజేషన్, భాష సంయోజనం, మెషిన్ ట్రాన్స్లేషన్, గ్రామర్ చెకింగ్, టెక్ట్స్ మైనింగ్ వంటి సాఫ్ట్వేర్ను అభివృద్ధి చేస్తారు. అవి..
ఇంటర్ కంప్యుటేషనల్ లింగ్విస్టిక్స్:
ఇందులో మానవుడు ఉపయోగించే భాష, కంప్యూటర్ ప్రోగ్రామ్ మధ్య సమన్వయాన్ని అవగాహన చేసుకునే అంశాలు ఉంటాయి. ఉదాహరణకు ఆడోబ్ ఫొటోషాప్లో ఎడిట్ చేసిన ఫొటోను జీమెయిల్ ద్వారా మెయిల్ చేయాలంటే.. అందుకనుగుణంగా కంప్యూటర్ కోడింగ్ను మార్పు చేయాల్సి ఉంటుంది. ఈ విధంగా రెండు సాంకేతిక విభాగాల మధ్య ఎటువంటి సమాచార లోపం లేకుండా సంబంధిత ప్రక్రియను నిర్వహించే అంశాలు ఉంటాయి.
వాయిస్ ఇంటర్ఫేస్ డిజైన్:
ఇందులో శబ్దం ఆధారంగా ఇస్తున్న సూచనల ద్వారా పని చేసే సాఫ్ట్వేర్ను రూపొందిస్తారు. ఇటీవలి కాలంలో ఈ విభాగానికి డిమాండ్ పెరుగుతోంది. వాయిస్ ఈ-మెయిల్ సాఫ్ట్వేర్, వాయిస్ జీపీఎస్, ఆపిల్ ఐఫోన్లోని సిరి వంటి సాఫ్ట్వేర్లను వీటికి చక్కటి ఉదాహరణలుగా పేర్కొనవచ్చు. ఈ విభాగంలో పనిచేయాలంటే కంప్యూటర్ డిజైన్కు సంబంధించిన అడ్వాన్స్డ్ నాలెడ్జ్ అవసరం.
మెషిన్ ట్రాన్స్లేషన్:
ఇందులోని సాఫ్ట్వేర్ ఒక సమాచారాన్ని ఒక భాష నుంచి మరొక భాషలోకి అనువదించే ప్రక్రియను నిర్వహిస్తుంది. ఇందులో యూజర్ డిమాండ్ మేరకు ఒక వెబ్సైట్లోని సమాచారాన్ని మరొక భాషలోకి అనువదించే ప్రక్రియ సాగుతుంది. ఇటీవలి కాలంలో ఈ ప్రక్రియను మరింత మెరుగ్గా రూపొందించడానికి విస్తృత స్థాయిలో పరిశోధనలు జరుగుతున్నాయి. ఈ నేపథ్యంలో ప్రస్తుతం ఈ విభాగానికి మంచి డిమాండ్ ఉంది. ఈ విభాగంలో పని చేయాలంటే సాఫ్ట్వేర్ డిజైన్కు సంబంధించిన అడ్వాన్స్డ్ నాలెడ్జ్, యూనిక్స్ వంటి ప్రోగ్రామ్స్పై అవగాహన ఉండాలి.
టెక్ట్స్ మైనింగ్:
ఇటీవలి కాలంలో బాగా ప్రాచుర్యం పొందుతున్న విభాగం టెక్ట్స్ మైనింగ్. ఇంటర్నెట్ లేదా ఆన్లైన్లో ఒక అంశానికి సంబంధించి విస్తృత స్థాయిలో సమాచారం అందుబాటులో ఉంటుంది. ఈ నేపథ్యంలో మనకు కావల్సిన సమాచారాన్ని ప్రత్యేకంగా వర్గీకరించి అందించేందుకు అభివృద్ధి చేసిన విభాగమే టెక్ట్స్ మైనింగ్. ఇందులో కావల్సిన సమాచారాన్ని గుర్తించడం, సమాచారాన్ని వర్గీకరించడం వంటి అంశాలు ఉంటాయి. అనంతంగా ఉండే డేటా నుంచి యూజర్ కోరిన సమాచారాన్ని ఒక క్రమ పద్ధతిలో వర్గీకరించి అందించే సాఫ్ట్వేర్ను రూపొందిస్తారు. దీనికి ఉన్న విస్తృత ప్రయోజనాల దృష్ట్యా అకడమిక్, వ్యాపార పరంగా ఈ రంగానికి డిమాండ్ పెరుగుతుంది.
కంప్యుటేషనల్ లింగ్విస్టిక్స్ కోర్సును ఆఫర్ చేస్తున్న ఇన్స్టిట్యూట్లు
బ్యాచిలర్/మాస్టర్స్ స్థాయిలో భాషా శాస్త్రం లేదా కంప్యూటర్ సైన్స్ నేపథ్యం ఉంటే ఈ రంగంలోకి ప్రవేశించవచ్చు. ఈ క్రమంలో భాషా శాస్త్రం చదివిన వారు కంప్యూటర్ లాంగ్వేజెస్ నేర్చుకోవాలి. కంప్యూటర్ నేపథ్యం ఉన్న వారు భాషా శాస్త్రం చదవాల్సి ఉంటుంది. కంప్యుటేషనల్ లింగ్విస్టిక్స్ విభాగానికి సంబంధించి అధిక శాతం కోర్సులు మాస్టర్స్ స్థాయిలో (లింగ్విస్టిక్స్, కంప్యూటర్ సైన్స్ వేర్వేరుగా) ఉన్నాయి. ఇటీవలి కాలంలో అకడమిక్ పరంగా కూడా ఈ సబ్జెక్ట్ ప్రాధాన్యత సంతరించుకుంటోంది. ఈ క్రమంలో అన్ని ఐఐటీలు, సెంట్రల్ ఇన్స్టిట్యూట్ ఆఫ్ ఇండియన్ లాంగ్వేజెస్, సీ-డాక్ వంటి ఇన్స్టిట్యూట్లు కంప్యుటేషనల్ లింగ్విస్టిక్స్ను ఇంటర్డిసిప్లినరీ కోర్సుగా అందిస్తున్నాయి. కొన్ని యూనివర్సిటీలు మాత్రమే కంప్యుటేషనల్ లింగ్విస్టిక్స్ను ఒక ప్రత్యేక కోర్సుగా బోధిస్తున్నాయి. ఈ విభాగంలో పీహెచ్డీ ఉంటే ఉన్నత శిఖరాలను అందుకోవచ్చు. కంప్యూటర్ సైన్స్, లింగ్విస్టిక్స్ రెండిటికీ సమ ప్రాధాన్యత ఇచ్చే విధంగా ఈ విభాగానికి చెందిన కోర్సుల కరిక్యులాన్ని రూపొందిస్తారు. ఇందులో స్క్రిప్టింగ్-కంప్యూటర్ ఎన్విరాన్మెంట్, నేచురల్ లాంగ్వేజ్ ప్రాసెస్, కంప్యుటేషనల్ లింగ్విస్టిక్స్, స్టాటిస్టిక్స్, మ్యాథమెటిక్స్, లాంగ్వేజ్ సొసైటీ, అడ్వాన్స్డ్ ప్రాబ్లమ్ సాల్వింగ్, డిస్క్రిట్ మ్యాథమెటిక్స్, అల్గారిథమ్స్ వంటి అంశాలు ఉంటాయి. కోర్సు పూర్తయిన తర్వాత టెక్నికల్తోపాటు లింగ్విస్టిక్స్ పరంగా కూడా స్థిరపడే అవకాశం ఉంటుంది.
అవకాశాలు ఇలా
ఇటీవలి కాలంలో కంప్యుటేషనల్ లింగ్విస్టిక్స్ రంగానికి డిమాండ్ పెరిగింది. ఈ రంగంలోని నిపుణులకు ఇంటర్నెట్ సెర్చ్ ఇంజిన్స్ను అభివృద్ధి చేస్తున్న లేదా ఆ ప్రక్రియను సులభతరం చేస్తున్న విభాగంలో పలు అవకాశాలు ఉంటాయి. ఈ క్రమంలో సెర్చ్ ఇంజిన్స్ ప్రొవైడింగ్ కంపెనీలు, ఆన్లైన్ డిక్షనరీస్ అందించే వెబ్సైట్లు, సెల్ఫోన్ కంపెనీలకు సాఫ్ట్వేర్లను అందించే సంస్థలు, ఏటీఎంలను రూపొందించే సాఫ్ట్వేర్ కంపెనీలు, జీపీఎస్ సర్వీస్ ప్రొవైడర్స్, మెషిన్ ట్రాన్స్లేషన్, సాఫ్ట్వేర్ కంపెనీలు, పబ్లిషింగ్ హౌసెస్, ప్రభుత్వానికి సంబంధించిన ప్రాజెక్ట్లను నిర్వహించే సంస్థలు.. ఇలా సాఫ్ట్వేర్ సేవలతో ముడిపడి ఉన్న అన్ని సంస్థలు కంప్యుటేషనల్ లింగ్విస్టిక్స్ నిపుణులను నియమించుకుంటున్నాయి. అంతేకాకుండా మైక్రోసాఫ్ట్, ఐబీఎం వంటి బహుళ జాతి సాఫ్ట్వేర్ సంస్థలు కూడా కంప్యూటర్ లింగ్విస్టిక్స్ నిపుణుల సేవలను వినియోగించుకుంటున్నాయి. ఉదాహరణకు మైక్రోసాఫ్ట్.. ఎంఎస్ వర్డ్లో టైప్ చేస్తున్నప్పుడే వచ్చే గ్రామర్ చెక్, ఆటోమేటిక్ సమ్మరైజేషన్ కోసం కంప్యూటర్ లింగ్విస్టిక్స్ నిపుణులను నియమించుకుంటుంది. ఎటువంటి ప్రోగ్రామింగ్ లాంగ్వేజ్ను నేర్చుకున్నారు? ప్రాజెక్ట్లలో అధికంగా వినియోగిస్తున్న భాష వంటి అంశాలపై అవకాశాలు ఆధారపడి ఉంటాయనే అంశాన్ని ఈ సందర్భంగా గుర్తుంచుకోవాలి. అంతేకాకుండా ఈ రంగానికి సంబంధించి ప్రోగ్రామింగ్ నాలెడ్జ్ అంతగా అవసరం లేని జాబ్స్ కూడా ఉంటాయి. అవి.. స్పీచ్ డేటా ఎవల్యూటేటర్స్, లింగ్విస్టిక్స్ డేటా మేనేజర్, అన్నోటేటర్ వంటివి.
వేతనాలు
సాధారణంగా నెలకు రూ. 20 వేల నుంచి రూ. 60 వేల వరకు లభిస్తుంది. పీహెచ్డీ డిగ్రీ ఉంటే నెలకు లక్ష రూపాయల వరకు సంపాదించుకోవచ్చు. విదేశాల్లో కూడా కంప్యుటేషనల్ లింగ్విస్టిక్స్కు విస్తృత అవకాశాలు ఉంటున్నాయి. ముఖ్యంగా అమెరికాలో అధిక శాతం ఉద్యోగాల కల్పన జరుగుతున్న రంగాల్లో ఇది ఒకటి. యూఎస్ లేబర్ స్టాటిస్టిక్స్ అంచనా ప్రకారం కంప్యుటేషనల్ లింగ్విస్టిక్స్ నిపుణుల సరాసరి వేతనం 80 వేల యూఎస్ డాలర్లు.
కంప్యూటర్ సైన్స్, లింగ్విస్టిక్స్ రెండింటి కలయిక కంప్యుటేషనల్ లింగ్విస్టిక్స్. ఇందులో కంప్యూటర్సైన్స్ ప్రోగ్రామ్స్, లింగ్విస్టిక్స్ భాష సిద్ధాంతాలు కలిపి బోధిస్తాం. పీజీ, పీహెచ్డీ స్థాయిలో ఈ కోర్సును అందిస్తున్నాం. మాస్టర్ ఆఫ్ కంప్యుటేషనల్ లింగ్విస్టిక్స్ (ఎంసీఎల్) కోర్సు వ్యవధి రెండేళ్లు. చాలామంది విద్యార్థులు ఈ కోర్సువైపు ఆకర్షితులవుతున్నారు. బీసీఏ, బీటెక్ (సీఎస్ఈ, ఐటీ), బీఏ లింగ్విస్టిక్స్తోపాటు ఏదైనా లాంగ్వేజ్ కోర్సులలో 15 క్రెడిట్స్తో (మూడు పేపర్లు) ఉత్తీర్ణులు ఈ కోర్సులో చేరొచ్చు. బీఎస్సీ (ఎంపీసీ), ఎంఏ (లింగ్విస్టిక్స్, ఇంగ్లిష్), ఎమ్మెస్సీ (మ్యాథ్స్, ఫిజిక్స్), ఎంసీఏ, ఎంటెక్ (కంప్యూటర్ సైన్స్) కోర్సులు పూర్తిచేసినవారు దరఖాస్తు చేసుకోవచ్చు. ఉన్నతవిద్య పరంగా పీహెచ్డీ చేయొచ్చు. విధుల విషయానికొస్తే.. లింగ్విస్టిక్స్ను విశ్లేషించి ప్రోగ్రామర్లకు అందించాలి. ప్రారంభంలో రూ.30 వేల వరకు వేతనం లభిస్తుంది.
-డాక్టర్ హరిప్రసాద్,
డిపార్టమెంట్ హెడ్, ఇఫ్లూ, హైదరాబాద్.
ఒకప్పుడు కంప్యూటర్, సెల్ఫోన్లలో కేవలం ఇంగ్లిష్ భాషను మాత్రమే వినియోగించే వారు. కానీ ప్రస్తుత మార్కెటింగ్ యుగంలో వినియోగదారులకు మెరుగైన సేవలు అందించే ఉద్దేశంతో ఇంటర్నెట్ నుంచి మన ఇంటి పక్క కనిపించే ఏటీఎం వరకు అన్ని సాఫ్ట్వేర్ ఆధారిత సేవల్లో స్థానిక భాషల వినియోగం పెరిగింది. ఆన్లైన్ వెబ్ డిక్షనరీలు, వెబ్సైట్లోని సమాచారం మరొక భాషలోకి ఆటోమేటిక్గా తర్జుమా వంటి ప్రక్రియలో స్థానిక భాష ఉపయోగం నిర్విరామంగా సాగుతోంది.
జోరుగా:
విప్లవంలా సాగుతున్న ఇంటర్నెట్ వినియోగం కేవలం ఇంగ్లిష్ భాషకు మాత్రమే పరిమితం కాలేదు. ఇంటర్నెట్ వినియోగాన్ని మరింత సులభతరం చేసే ఉద్దేశంతో ఆయా దేశాలను బట్టి స్థానిక భాషల వినియోగానికి ఇంటర్నెట్ సెర్చ్ ఇంజిన్స్, సాఫ్ట్వేర్ ఆధారిత సేవలు అందించే వెబ్సైట్స్ అధిక ప్రాధాన్యతనిస్తున్నాయి. ఉదాహరణకు ఫేస్బుక్, జీమెయిల్ లేదా ఇతర మాధ్యమాల్లో ఇంగ్లిష్లో టైప్ చేస్తున్న పదాలు అదే సమాన అర్థంతో తెలుగులో ప్రత్యక్షమవ్వడం (ఉదాహరణకు-comeకమ్) వంటివి. ఈ నేపథ్యంలో ఇంటర్నెట్ను ఆయా స్థానిక భాషలకనుగుణంగా మలిచే ప్రక్రియ జోరుగా కొనసాగుతోంది. దాంతో భాష, కంప్యూటర్ ప్రోగ్రామింగ్ పట్ల అవగాహన ఉన్న వారికి సరికొత్త వేదికగా నిలుస్తోంది.. కంప్యుటేషనల్ లింగ్విస్టిక్స్. మనిషి మాట్లాడే, రాసే ప్రక్రియలో ఉపయోగించే భాష, కంప్యూటర్ల మధ్య సంబంధాన్ని అవగాహన చేసుకోవడం ద్వారా ఒక కంప్యూటర్ భాషను రూపొందించడమే కంప్యుటేషనల్ లింగ్విస్టిక్స్.
ప్రక్రియులు ఎన్నో:
కంప్యుటేషనల్ లింగ్విస్టిక్స్లో ఎన్నో ప్రక్రియలు ఉంటాయి. అవి.. వివిధ భాషల్లోని డాక్యుమెంట్ల అనువాదం, స్వరాన్ని గుర్తించే (voice recognition) సాఫ్ట్వేర్ను రూపొందించడం, ఆటోమేటెడ్ ఈ-మెయిల్, డేటా మైనింగ్ వంటివి. ఇందులో వాయిస్ జీపీఎస్, గూగుల్ ట్రాన్స్లేటర్, భాషకు సంబంధించిన ఇతర సాంకేతిక అంశాలు ఇమిడి ఉంటాయి. అంతేకాకుండా మెషిన్ ట్రాన్స్లేషన్, నేచురల్ లాంగ్వేజ్ ఇంటర్ఫేసెస్, గ్రామర్ అండ్ స్టైల్ చెకింగ్, డాక్యుమెంట్ ప్రాసెసింగ్-ఇన్ఫర్మేషన్ రిట్రివల్, కంప్యూటర్ అసిస్టెడ్ లాంగ్వేజ్ లెర్నింగ్ వంటి ప్రక్రియలు ఉంటాయి. కంప్యుటేషనల్ లింగ్విస్టిక్స్లో ఫిలాసఫీ, సైకాలజీ వంటి అంశాలు కూడా కొంత వరకు ఇమిడి ఉంటాయి. సంబంధిత సాఫ్ట్వేర్ను అభివృద్ధి చేసే క్రమంలో కంప్యూటర్ నిపుణులు, సైకాలజిస్ట్స్, మ్యాథమెటీషియన్స్, భాషా వేత్తలు (లాంగ్వేజ్ ఎక్స్పర్ట్స్) కలిసి పని చేస్తారు. కంప్యుటేషనల్ లింగ్విస్టిక్స్ నిపుణులు నిర్వహించే విధులను బట్టి ఈ రంగంలో సాధారణంగా రెండు విభాగాలు ఉంటాయి. అవి.. అప్లయిడ్ లింగ్విస్టిక్స్, థియరిటికల్ లింగ్విస్టిక్స్.
థియరిటికల్ లింగ్విస్టిక్స్:
ఇందులో భాష, అభిజ్ఞా వికాసానికి (cognitive science) సంబంధించిన సిద్ధాంతాలపై లింగ్విస్టిక్ నిపుణులు పని చేస్తారు. అంటే భాషకు సంబంధించిన అంశాలను మానసిక దృక్పథం (psycholinguistics)తో అవగాహన చేసుకునే ప్రక్రియ ఇక్కడ సాగుతుంది. తద్వారా మానవుడు ఉపయోగించే భాషను పకడ్బందీగా అవగాహన చేసుకునే సాఫ్ట్వేర్ను అభివృద్ధి చేసే అవకాశం చిక్కుతుంది. ఇందులో సాంకేతిక అంశాల కంటే భాషాపరమైన అంశాలపై ఎక్కువగా దృష్టి ఉంటుంది.
అప్లైడ్ లింగ్విస్టిక్స్:
ఇందులో సాంకేతిక అంశాలు అధికంగా ఉంటాయి. ఈ క్రమంలో అవుట్కమ్ రూపంలో వచ్చే భాషకు ఒక రూపాన్నిస్తారు. ఒక రకంగా చెప్పాలంటే మానవ భాష పట్ల కొంత అవగాహన ఉన్న సాఫ్ట్వేర్ను అభివృద్ధి చేస్తారు. ఈ క్రమంలోటెక్ట్స్-టు-స్పీచ్ టెక్నాలజీ, స్పీచ్-టు-టెక్ట్స్ వంటి సాంకేతిక అంశాలపై పని చేస్తారు. టెక్ట్స్-టు-స్పీచ్లో భాగంగా మానవుడు ఇచ్చిన నిర్దేశాన్ని కంప్యూటర్ అవగాహన చేసుకుంటుంది (ఈ నిర్దేశం ప్రశ్న రూపంలో ఉంటుంది.
ఈ ప్రక్రియలో ప్రశ్నను టైప్ చేయడం లేదా మాట్లాడడం ద్వారా మానవ భాషలో కంప్యూటర్కు అందిస్తాము). స్పీచ్-టు-టెక్ట్స్ విభాగంలో మానవ భాష నుంచి మెషీన్ అర్థం చేసుకునే టెక్ట్స్ను రూపొందిస్తారు. అంతేకాకుండా ఆటోమేటిక్ మెషిన్ ట్రాన్స్లేషన్ ప్రక్రియ ద్వారా వివిధ భాషల్లో అనువాద ప్రక్రియను అభివృద్ధి చేస్తారు. సెర్చ్ ఇంజిన్కు సంబంధించిన ఇంటెలిజెంట్ వ్యవస్థను కూడా ఈ ప్రక్రియ ద్వారానే రూపొందిస్తారు.
విధులు-విభాగాలు:
ఇంటర్నెట్, మొబైల్ వంటి మాధ్యమాల్లో ఉపయోగించే వివిధ భాషలకు సంబంధించిన ప్రక్రియలను సులభతరం చేసే విధులను కంప్యుటేషనల్ లింగ్విస్టిక్స్ నిపుణులు నిర్వహిస్తుంటారు. ఈ క్రమంలో యాంత్రిక పద్ధతిలో భాషా శాస్త్ర నియమాలను దృష్టిలో పెట్టుకుని పద కోశాన్ని రూపొందించడం, వివిధ భాషా ప్రక్రియలను సులభతరం చేయడం, సంబంధిత సాఫ్ట్వేర్, ప్లాట్ఫామ్లను రూపొందించే అంశాలపై పని చేస్తుంటారు. కంప్యూటర్ ప్రోగ్రామ్లో ఉపయోగించే భాషా శాస్త్ర ప్రక్రియలను కంప్యూటర్ లింగ్విస్టిక్స్ నిపుణులు రూపొందిస్తారు. ఇందులో ఎన్నో విభాగాలు ఉంటాయి. ఈ క్రమంలో స్పీచ్ రికగ్నైజేషన్, భాష సంయోజనం, మెషిన్ ట్రాన్స్లేషన్, గ్రామర్ చెకింగ్, టెక్ట్స్ మైనింగ్ వంటి సాఫ్ట్వేర్ను అభివృద్ధి చేస్తారు. అవి..
ఇంటర్ కంప్యుటేషనల్ లింగ్విస్టిక్స్:
ఇందులో మానవుడు ఉపయోగించే భాష, కంప్యూటర్ ప్రోగ్రామ్ మధ్య సమన్వయాన్ని అవగాహన చేసుకునే అంశాలు ఉంటాయి. ఉదాహరణకు ఆడోబ్ ఫొటోషాప్లో ఎడిట్ చేసిన ఫొటోను జీమెయిల్ ద్వారా మెయిల్ చేయాలంటే.. అందుకనుగుణంగా కంప్యూటర్ కోడింగ్ను మార్పు చేయాల్సి ఉంటుంది. ఈ విధంగా రెండు సాంకేతిక విభాగాల మధ్య ఎటువంటి సమాచార లోపం లేకుండా సంబంధిత ప్రక్రియను నిర్వహించే అంశాలు ఉంటాయి.
వాయిస్ ఇంటర్ఫేస్ డిజైన్:
ఇందులో శబ్దం ఆధారంగా ఇస్తున్న సూచనల ద్వారా పని చేసే సాఫ్ట్వేర్ను రూపొందిస్తారు. ఇటీవలి కాలంలో ఈ విభాగానికి డిమాండ్ పెరుగుతోంది. వాయిస్ ఈ-మెయిల్ సాఫ్ట్వేర్, వాయిస్ జీపీఎస్, ఆపిల్ ఐఫోన్లోని సిరి వంటి సాఫ్ట్వేర్లను వీటికి చక్కటి ఉదాహరణలుగా పేర్కొనవచ్చు. ఈ విభాగంలో పనిచేయాలంటే కంప్యూటర్ డిజైన్కు సంబంధించిన అడ్వాన్స్డ్ నాలెడ్జ్ అవసరం.
మెషిన్ ట్రాన్స్లేషన్:
ఇందులోని సాఫ్ట్వేర్ ఒక సమాచారాన్ని ఒక భాష నుంచి మరొక భాషలోకి అనువదించే ప్రక్రియను నిర్వహిస్తుంది. ఇందులో యూజర్ డిమాండ్ మేరకు ఒక వెబ్సైట్లోని సమాచారాన్ని మరొక భాషలోకి అనువదించే ప్రక్రియ సాగుతుంది. ఇటీవలి కాలంలో ఈ ప్రక్రియను మరింత మెరుగ్గా రూపొందించడానికి విస్తృత స్థాయిలో పరిశోధనలు జరుగుతున్నాయి. ఈ నేపథ్యంలో ప్రస్తుతం ఈ విభాగానికి మంచి డిమాండ్ ఉంది. ఈ విభాగంలో పని చేయాలంటే సాఫ్ట్వేర్ డిజైన్కు సంబంధించిన అడ్వాన్స్డ్ నాలెడ్జ్, యూనిక్స్ వంటి ప్రోగ్రామ్స్పై అవగాహన ఉండాలి.
టెక్ట్స్ మైనింగ్:
ఇటీవలి కాలంలో బాగా ప్రాచుర్యం పొందుతున్న విభాగం టెక్ట్స్ మైనింగ్. ఇంటర్నెట్ లేదా ఆన్లైన్లో ఒక అంశానికి సంబంధించి విస్తృత స్థాయిలో సమాచారం అందుబాటులో ఉంటుంది. ఈ నేపథ్యంలో మనకు కావల్సిన సమాచారాన్ని ప్రత్యేకంగా వర్గీకరించి అందించేందుకు అభివృద్ధి చేసిన విభాగమే టెక్ట్స్ మైనింగ్. ఇందులో కావల్సిన సమాచారాన్ని గుర్తించడం, సమాచారాన్ని వర్గీకరించడం వంటి అంశాలు ఉంటాయి. అనంతంగా ఉండే డేటా నుంచి యూజర్ కోరిన సమాచారాన్ని ఒక క్రమ పద్ధతిలో వర్గీకరించి అందించే సాఫ్ట్వేర్ను రూపొందిస్తారు. దీనికి ఉన్న విస్తృత ప్రయోజనాల దృష్ట్యా అకడమిక్, వ్యాపార పరంగా ఈ రంగానికి డిమాండ్ పెరుగుతుంది.
కంప్యుటేషనల్ లింగ్విస్టిక్స్ కోర్సును ఆఫర్ చేస్తున్న ఇన్స్టిట్యూట్లు
- ఐఐఐటీ-హైదరాబాద్
వెబ్సైట్: www.iiit.ac.in - జవహర్లాల్ నెహ్రూ యూనివర్సిటీ-న్యూఢిల్లీ
వెబ్సైట్: www.jnu.ac.in - ఢిల్లీ యూనివర్సిటీ
వెబ్సైట్: www.du.ac.in - యూనివర్సిటీ ఆఫ్ హైదరాబాద్
వెబ్సైట్: www.uohyd.ac.in - ఇఫ్లూ-హైదరాబాద్
వెబ్సైట్: www.efluniversity.ac.in
బ్యాచిలర్/మాస్టర్స్ స్థాయిలో భాషా శాస్త్రం లేదా కంప్యూటర్ సైన్స్ నేపథ్యం ఉంటే ఈ రంగంలోకి ప్రవేశించవచ్చు. ఈ క్రమంలో భాషా శాస్త్రం చదివిన వారు కంప్యూటర్ లాంగ్వేజెస్ నేర్చుకోవాలి. కంప్యూటర్ నేపథ్యం ఉన్న వారు భాషా శాస్త్రం చదవాల్సి ఉంటుంది. కంప్యుటేషనల్ లింగ్విస్టిక్స్ విభాగానికి సంబంధించి అధిక శాతం కోర్సులు మాస్టర్స్ స్థాయిలో (లింగ్విస్టిక్స్, కంప్యూటర్ సైన్స్ వేర్వేరుగా) ఉన్నాయి. ఇటీవలి కాలంలో అకడమిక్ పరంగా కూడా ఈ సబ్జెక్ట్ ప్రాధాన్యత సంతరించుకుంటోంది. ఈ క్రమంలో అన్ని ఐఐటీలు, సెంట్రల్ ఇన్స్టిట్యూట్ ఆఫ్ ఇండియన్ లాంగ్వేజెస్, సీ-డాక్ వంటి ఇన్స్టిట్యూట్లు కంప్యుటేషనల్ లింగ్విస్టిక్స్ను ఇంటర్డిసిప్లినరీ కోర్సుగా అందిస్తున్నాయి. కొన్ని యూనివర్సిటీలు మాత్రమే కంప్యుటేషనల్ లింగ్విస్టిక్స్ను ఒక ప్రత్యేక కోర్సుగా బోధిస్తున్నాయి. ఈ విభాగంలో పీహెచ్డీ ఉంటే ఉన్నత శిఖరాలను అందుకోవచ్చు. కంప్యూటర్ సైన్స్, లింగ్విస్టిక్స్ రెండిటికీ సమ ప్రాధాన్యత ఇచ్చే విధంగా ఈ విభాగానికి చెందిన కోర్సుల కరిక్యులాన్ని రూపొందిస్తారు. ఇందులో స్క్రిప్టింగ్-కంప్యూటర్ ఎన్విరాన్మెంట్, నేచురల్ లాంగ్వేజ్ ప్రాసెస్, కంప్యుటేషనల్ లింగ్విస్టిక్స్, స్టాటిస్టిక్స్, మ్యాథమెటిక్స్, లాంగ్వేజ్ సొసైటీ, అడ్వాన్స్డ్ ప్రాబ్లమ్ సాల్వింగ్, డిస్క్రిట్ మ్యాథమెటిక్స్, అల్గారిథమ్స్ వంటి అంశాలు ఉంటాయి. కోర్సు పూర్తయిన తర్వాత టెక్నికల్తోపాటు లింగ్విస్టిక్స్ పరంగా కూడా స్థిరపడే అవకాశం ఉంటుంది.
అవకాశాలు ఇలా
ఇటీవలి కాలంలో కంప్యుటేషనల్ లింగ్విస్టిక్స్ రంగానికి డిమాండ్ పెరిగింది. ఈ రంగంలోని నిపుణులకు ఇంటర్నెట్ సెర్చ్ ఇంజిన్స్ను అభివృద్ధి చేస్తున్న లేదా ఆ ప్రక్రియను సులభతరం చేస్తున్న విభాగంలో పలు అవకాశాలు ఉంటాయి. ఈ క్రమంలో సెర్చ్ ఇంజిన్స్ ప్రొవైడింగ్ కంపెనీలు, ఆన్లైన్ డిక్షనరీస్ అందించే వెబ్సైట్లు, సెల్ఫోన్ కంపెనీలకు సాఫ్ట్వేర్లను అందించే సంస్థలు, ఏటీఎంలను రూపొందించే సాఫ్ట్వేర్ కంపెనీలు, జీపీఎస్ సర్వీస్ ప్రొవైడర్స్, మెషిన్ ట్రాన్స్లేషన్, సాఫ్ట్వేర్ కంపెనీలు, పబ్లిషింగ్ హౌసెస్, ప్రభుత్వానికి సంబంధించిన ప్రాజెక్ట్లను నిర్వహించే సంస్థలు.. ఇలా సాఫ్ట్వేర్ సేవలతో ముడిపడి ఉన్న అన్ని సంస్థలు కంప్యుటేషనల్ లింగ్విస్టిక్స్ నిపుణులను నియమించుకుంటున్నాయి. అంతేకాకుండా మైక్రోసాఫ్ట్, ఐబీఎం వంటి బహుళ జాతి సాఫ్ట్వేర్ సంస్థలు కూడా కంప్యూటర్ లింగ్విస్టిక్స్ నిపుణుల సేవలను వినియోగించుకుంటున్నాయి. ఉదాహరణకు మైక్రోసాఫ్ట్.. ఎంఎస్ వర్డ్లో టైప్ చేస్తున్నప్పుడే వచ్చే గ్రామర్ చెక్, ఆటోమేటిక్ సమ్మరైజేషన్ కోసం కంప్యూటర్ లింగ్విస్టిక్స్ నిపుణులను నియమించుకుంటుంది. ఎటువంటి ప్రోగ్రామింగ్ లాంగ్వేజ్ను నేర్చుకున్నారు? ప్రాజెక్ట్లలో అధికంగా వినియోగిస్తున్న భాష వంటి అంశాలపై అవకాశాలు ఆధారపడి ఉంటాయనే అంశాన్ని ఈ సందర్భంగా గుర్తుంచుకోవాలి. అంతేకాకుండా ఈ రంగానికి సంబంధించి ప్రోగ్రామింగ్ నాలెడ్జ్ అంతగా అవసరం లేని జాబ్స్ కూడా ఉంటాయి. అవి.. స్పీచ్ డేటా ఎవల్యూటేటర్స్, లింగ్విస్టిక్స్ డేటా మేనేజర్, అన్నోటేటర్ వంటివి.
వేతనాలు
సాధారణంగా నెలకు రూ. 20 వేల నుంచి రూ. 60 వేల వరకు లభిస్తుంది. పీహెచ్డీ డిగ్రీ ఉంటే నెలకు లక్ష రూపాయల వరకు సంపాదించుకోవచ్చు. విదేశాల్లో కూడా కంప్యుటేషనల్ లింగ్విస్టిక్స్కు విస్తృత అవకాశాలు ఉంటున్నాయి. ముఖ్యంగా అమెరికాలో అధిక శాతం ఉద్యోగాల కల్పన జరుగుతున్న రంగాల్లో ఇది ఒకటి. యూఎస్ లేబర్ స్టాటిస్టిక్స్ అంచనా ప్రకారం కంప్యుటేషనల్ లింగ్విస్టిక్స్ నిపుణుల సరాసరి వేతనం 80 వేల యూఎస్ డాలర్లు.
కంప్యూటర్ సైన్స్, లింగ్విస్టిక్స్ రెండింటి కలయిక కంప్యుటేషనల్ లింగ్విస్టిక్స్. ఇందులో కంప్యూటర్సైన్స్ ప్రోగ్రామ్స్, లింగ్విస్టిక్స్ భాష సిద్ధాంతాలు కలిపి బోధిస్తాం. పీజీ, పీహెచ్డీ స్థాయిలో ఈ కోర్సును అందిస్తున్నాం. మాస్టర్ ఆఫ్ కంప్యుటేషనల్ లింగ్విస్టిక్స్ (ఎంసీఎల్) కోర్సు వ్యవధి రెండేళ్లు. చాలామంది విద్యార్థులు ఈ కోర్సువైపు ఆకర్షితులవుతున్నారు. బీసీఏ, బీటెక్ (సీఎస్ఈ, ఐటీ), బీఏ లింగ్విస్టిక్స్తోపాటు ఏదైనా లాంగ్వేజ్ కోర్సులలో 15 క్రెడిట్స్తో (మూడు పేపర్లు) ఉత్తీర్ణులు ఈ కోర్సులో చేరొచ్చు. బీఎస్సీ (ఎంపీసీ), ఎంఏ (లింగ్విస్టిక్స్, ఇంగ్లిష్), ఎమ్మెస్సీ (మ్యాథ్స్, ఫిజిక్స్), ఎంసీఏ, ఎంటెక్ (కంప్యూటర్ సైన్స్) కోర్సులు పూర్తిచేసినవారు దరఖాస్తు చేసుకోవచ్చు. ఉన్నతవిద్య పరంగా పీహెచ్డీ చేయొచ్చు. విధుల విషయానికొస్తే.. లింగ్విస్టిక్స్ను విశ్లేషించి ప్రోగ్రామర్లకు అందించాలి. ప్రారంభంలో రూ.30 వేల వరకు వేతనం లభిస్తుంది.
-డాక్టర్ హరిప్రసాద్,
డిపార్టమెంట్ హెడ్, ఇఫ్లూ, హైదరాబాద్.
Published date : 20 Dec 2013 10:18AM