தகவல் விஞ்ஞானம் – கற்றுக் கொள்ள மற்றும் பயிற்சி வாய்ப்புகள் : பகுதி 3 

கல்லூரியில் படித்து முடித்தவுடன் டேடா விஞ்ஞானி என்பது நடக்காத விஷயம் என்பது முதல் இரண்டு கட்டுரைகளில் புரிந்திருக்கும். சரி, எப்படி டேடா விஞ்ஞானியாவது? இத்துறை இன்னும் சில ஆண்டுகளில் வசீகரம் இழந்து விடுமா? கணினிகளின் முன்னேற்றம், இந்தத் துறையை தேவையற்ற ஒன்றாக்கி விடுமா? இது போன்ற கேள்விகளுக்கு இந்தப் பகுதியில் பதில் தர முயல்கிறேன்.
முதலாவது, என்.ஐ.ஐ.டி., ஆப்டெக் போன்ற நிரலர்களை உருவாக்கும் அமைப்புகளிலிருந்து தரவு விஞ்ஞானம் கற்க சாத்தியமில்லை. இதற்கென்று சில பிரத்தியேகக் கல்வி அமைப்புகள் இந்தியாவில் உள்ளன: http://analyticsindiamag.com/top-analytics-training-institutes-india-ranking-2014/
என்னுடைய பார்வையில், அடிப்படையில் தரவு விஞ்ஞானம் பயில விழைபவர்கள் சில முக்கியமான விஷயங்களை தங்களுடைய இளங்கலை மற்றும் முதுகலைப் பயிற்சியில் அவசியம் படிக்க வேண்டும்;
1. கணினி விஞ்ஞானம் மற்றும் மென்பொருள் பொறியியல்
2. புள்ளியியல்
3. தரவுதளங்கள் மற்றும் சீக்வல் (SQL) அல்லது தரவு மேலாண்மை
4. முடிந்தால், ஹதூப், மேகக் கணிமை, பற்றிய புரிதல்
5. முக்கியமாக, வியாபார ஆய்வுப் பயிற்சி
இரண்டாவது, மேலே சொன்ன அனைத்தையும் கரைத்துக் குடித்தாலும் உடனே டேடா விஞ்ஞானியாகி விட முடியாது. இது ஒரு கடுமையான பயணம் – முதலில் பிற விஞ்ஞானிகளின் கீழ் வேலை செய்து, பல ஆண்டுகள் இந்தத் துறையைப் புரிந்து கொள்ளுதல் அவசியம்.
மூன்றாவதாக, மாறிக் கொண்டே வரும் இத்துறையில் தன்னை புதுப்பிக்கும் திறன் படைத்தவர்களே வெற்றி பெறுவார்கள். ஏராளமாகப் படித்து முனைவர் பட்டம் பெற்று விட்டேன் என்ற கதை அதிக நாட்களுக்கு உதவாது. நேற்று பல்கலைக்கழகத்தில் படித்தவர்கள், உங்களை விட அதிகம் தெரிந்திருக்கும் வாய்ப்பு இந்தத் துறையில் என்றும் உள்ள அபாயம்.
data-sciences-3-pic-1
 
இந்தத் துறையில் ஆரம்பிப்பவர்களுக்கு இரண்டு வகை சவால்கள் இருக்கும். இதில் முதல் வகை, புள்ளியியல் துறையில் முனைவர் பட்டம் பெற்று இத்துறையைத் தேர்ந்தெடுப்பவர்கள். இவர்கள், ஆரம்ப கட்டங்களில், ஒரு டேடா விஞ்ஞானியின் கீழ் வேலை செய்யும் பொழுது இவர்களுக்கு நேரும் நெருக்கடிகள் சில:
* ஏராளமாகப் புள்ளியியல் படித்துவிட்டு, வியாபாரங்களில், அடிப்படை தரவுப் போராட்டங்கள் எளிதில் போரடிக்கத் தொடங்கிவிடும்
* கணினி மென்பொருள் துறைக்கே உரியப் பல குழப்பமான சொற்றொடர்கள் இவர்களுடைய தன்னம்பிக்கையையே உலுக்கும் தன்மை படைத்தவை
* பெரும்பாலும் புள்ளியியலில் முனைவர் பட்டம் பெற்றவர்கள் அதிகம் வியாபாரம் பற்றிய புரிதல் இன்றி தானுண்டு, தன் தரவு உண்டு என்றிருப்பார்கள். இவர்கள் வியாபாரச் செயல் முறைகள், வழக்கங்கள், மற்றும் நிதி பற்றிய புரிதலுக்குத் தடுமாறுவது இயற்கையான ஒன்று. ஆனால், தரவில் வீரச் செயல்கள் ஓரளவிற்கு மேல் பயன்பட வேண்டுமானால், வியாபாரம் பற்றிய புரிதல் அவசியம்
இரண்டாம் வகை, முதுகலையில் கணினி விஞ்ஞானம் மற்றும் வியாபார ஆய்வு படித்தவர்களின் ஆரம்ப நெருக்கடிகள்:
* வியாபார ஆய்வு மற்றும் கணினி விஞ்ஞானம் கற்கையில், தரவு என்பது பற்றிய மேலோட்டமான புரிதல் மட்டுமே இருக்கும். அதன் முக்கியத்துவம் ஒரு தரவை தேக்கும் அமைப்பில் சேர்ந்த பிறகே
புரியும். இந்தப் புதுப் புரிதல், சில மாதங்களில் அலுப்பு தட்டும் வாய்ப்பு, நிறைய உள்ளது. முதல் வகையினரைப் போல தரவுப் போராட்டங்கள் அலுக்கத் தொடங்கி விடும்
* ஆரம்ப நாட்களில், பல நுகர்வோருடன் சேர்ந்து ஒரு புதிய ஸிஸ்டமை உருவாக்கத் துடிக்கும் இவர்களுக்கு ஏமாற்றமே மிஞ்சும். ஏனென்றால், படிப்பிருந்தாலும், பல வருட வியாபார அனுபவம் இல்லாததால், மற்ற வியாபார ஆய்வாளர்கள் கீழே பணி புரிந்து, சில சமயம் ஒரு குமாஸ்தா போல வேலை செய்யவும் தேவைப்படும். அட, என்றைக்கு ஒரு முழு ஸிஸ்டமிற்கு நாம் பொறுப்பேற்பது என்ற ஆதங்கம் இவ்வகையினருக்கு ஆரம்பத்தில், ஒரு ஐந்து ஆண்டுகள் இருப்பது மறுக்க முடியாத உண்மை
* இவ்வகையினரின் ஆரம்ப பத்தாண்டுகளில், தனக்கு அதிகம் புள்ளியியல் தெரியாததும், ஒரு குறையாகப் படலாம்.
data-sciences-3-pic-2
இரண்டு சாராரும் வித்தியாசமின்றித் தவிப்பது, ஆய்வின் முடிவுகளைத் தெளிவாக மேலாண்மைக்கு அழகாகப் புரியும்படி விளக்கும் பணி. எல்லா பின்னணி விஷயங்களும் எளிதில் படித்து அல்லது பயிற்சியில் பெற்று விடலாம். ஆனால், காட்சியளிப்புத் திறன் என்பது சிலருக்கு எளிதில் அமையும். மற்றவர்களுக்குக் கடைசி வரை போராட்டம்தான்.
இவ்விரண்டு சாராரும் செய்யும் சில ஆரம்ப அசட்டுத்தனங்கள் என் பார்வையில் இவை;
* தரவு சொல்லும் கதையை சரியாக முழுவதும் புரிந்து கொள்ளாமல் மிகவும் டெக்னிகலாக விளக்கத் தொடங்கினால், அனுபவமின்மையை வெளிச்சம் போட்டுக் காட்டிவிடும்
* சிலர் தரவுடன் மிகவும் தன்னை ஒருங்கிணைத்துக் கொண்டு, வியாபாரம் என்னவோ தானே தொடங்கியது போல, தீர்வுகளை முன் வைக்கத் தொடங்கி விடுவார்கள். புத்திசாலி சினிமா டைரக்டர் எப்படி சில கதைப் பகுதிகளை இளையராஜாவின் பின்னணி இசைக்கு விட்டு வைப்பாரோ, அதே போல, டேடா விஞ்ஞானிகளும் தீர்வுகளை மேல்மட்ட மேலாண்மையினரிடம் விட்டு விட வேண்டும்
* தரவு சொல்லும் கதையை மேலாண்மையினருக்கு விளக்குவது ஒரு தனிக்கலை. தரவின் கதைக்கும் டேடா விஞ்ஞானியின் கதைக்கும் மிகப் பெரிய வித்தியாசம் உள்ளது. உதாரணத்திற்கு, தரவின் கதைப்படி, ஒரு 200 கோடி ரூபாய் முதலீடு செய்து சில வியாபார மாற்றங்கள் நிகழ்த்த வேண்டும் என்று வைத்துக் கொள்வோம். இந்த 200 கோடி முதலீடு பயனளிக்குமா என்று நிச்சயம் சொல்ல முடியாது; அப்படியே பயனளித்தாலும், எதிர்பார்த்த லாபத்தையோ, செயல்திறனையோ அளிக்கும் என்பதும் சொல்வதற்கில்லை. டேடா விஞ்ஞானியின் கதையாக இருந்தால், அது, அவரது தோல்வியாக பாவிக்கப்படும். சரியான முறையில் தரவின் கதையை சரியாகச் சொன்னால், மேலாண்மை, இம்முயற்சியில் லாபம் வரும் பொறுப்பை தானே ஏற்றுக் கொள்ளும்.
data-sciences-3-pic-3
ஆக, நாம் முக்கியமாக இத்துறையைப் பற்றித் தெரிந்து கொள்ள வேண்டிய விஷயங்கள்:
* தரவைப் பற்றிய முழுப் புரிதலுடன் யாரும் பல்கலைக்கழகங்களிலிருந்து வருவதில்லை
* தரவுடன் தரப் போராட்டம் என்பது இந்தத் துறையில் ஒரு அம்சம் – அவ்வளவுதான். அதில் விடாமல் போராடி வெற்று பெறுபவர்களே இத்துறையில் வெற்றி பெற முடியும்
* டேடா விஞ்ஞானியின் வசீகர வாழ்க்கை வெறும் 5% தான். மற்ற 95% தரவு ஆய்வு சார்ந்த வசீகரமற்ற ஒன்று
* தரவு விஞ்ஞானம் பற்றிய பல பயிற்சி அமைப்புகள் இருந்தாலும், உங்களுடைய நிறுவனத்திற்குத் தேவையான பயிற்சியை எந்த ஒரு அமைப்பும் வழங்கப் போவதில்லை
* மாறிக் கொண்டே வரும் மென்பொருள் கருவிகளை, எந்தப் பின்னணியிலிருந்து நீங்கள் வந்தாலும், அறிந்து கொண்டு, உங்களைப் புதுப்பித்துக் கொண்டே இருப்பது அவசியம்
* கடைசியாக, இது ஒரு பல துறைகளின் சங்கமத் துறை. இதனால், இளங்கலை தரவு விஞ்ஞானப் பட்டப் படிப்பு என்றால் ஓட்டம் பிடியுங்கள்
அடுத்து, இத்துறையின் வசீகரம் எதிர்காலத்தில் குறைந்து விடுமா என்ற கேள்விக்கு வருவோம். முதலில், கடந்த இரண்டு ஆண்டு காலமாக அதிகம் ஊதி வாசிக்கப்பட்ட விஷயம் டேடா விஞ்ஞானி என்ற ஒரு பதவி. இந்தப் பதவி, ஒவ்வொரு பெரிய நிறுவனத்திலும், எனக்குத் தெரிந்தவரை 25 ஆண்டுகளாக இருக்கும் ஒரு பதவி – வித்தியாசம் என்னவென்றால், இவர்களை டேடா விஞ்ஞானிகள் என்று முன்பு அழைக்கவில்லை. தரவு ஆய்வாளர் என்று வங்கிகள், அரசாங்கங்கள், காப்பீடு, தொலைத் தொடர்பு நிறுவனங்கள் அழைத்து வந்தன. கடந்த 20 ஆண்டுகளாக, ஏராளமான தரவை நிறுவனங்கள் தேக்கும் வசதி வந்ததால், தரவு ஆய்வாளர்களின் தேவை அதிகரித்து விட்டது. எந்திரக் கற்றலியல் வளர்ந்து வருகையில், டேடா விஞ்ஞானிகள் மிகவும் அவசியமாகி விட்டனர்.
குப்பையில் வைரமும் இருக்கிறது என்பதை, பல நிறுவனங்கள் உணரத் தொடங்கிவிட்டன. உதாரணத்திற்கு, புதிய ஒரு வாடிக்கையாளரை உருவாக்குவது ஒரு நிறுவனத்திற்கு, ஒரு பெரிய செலவு. வியாபாரம் என்றிருந்தால், விற்பனை செலவு என்பது இருக்கத்தானே செய்யும் என்று வாதம் செய்த காலம் மலையேறிவிட்டது. இன்று,, புதிய வாடிக்கையாளர்களைத் தேடிப் பிடிப்பதோடு, மிக முக்கியமான விஷயம், இருக்கும் வாடிக்கையாளரைத் தக்க வைத்துக் கொள்வது. எந்த வாடிக்கையாளர், இதோ, இன்னும் 6 மாதங்களில் வெளியேற இருக்கிறார் என்பது மிக முக்கிய விஷயம். இவர்களைத் தக்க வைத்துக் கொள்ள ஆகும் செலவு, புதிய வாடிக்கையாளரைப் பிடிக்கும் செலவை விடக் குறைவு. எப்படி 6 மாதங்களில் விலகப் போகும் வாடிக்கையாளரைக் கண்டு பிடிப்பது? இங்குதான் டேடா விஞ்ஞானிகள், இருக்கும் தரவைக் கொண்டு, உதவ முடியும்.
கணினி கற்றலியல் வளர்ந்து இன்னும் சில ஆண்டுகளில், டேடா விஞ்ஞானியே தேவையில்லை என்றாகி விடுமா? இரண்டாம் பகுதியில் சொன்னது போல, ஆரம்ப கட்ட தரவுப் போராட்டங்களுக்கே இவ்வகை எந்திரக் கற்றலியல் பயன் தருகிறது. மற்றபடி, ஏராளமான தரவிலிருந்து பயனுள்ள விஷயங்களை வெளிக் கொண்டு வருவது இன்னும் மனிதத் திறமை சார்ந்த விஷயமாகவே உள்ளது. எதிர்காலத்தில், எந்திரக் கற்றலியலின் பங்கு அதிகரித்தாலும், நமது தரவு ஆய்வுத் தேவைகளும் அதிகரித்துக் கொண்டே இருக்கும். ஓரளவிற்கு மனிதர்களால் உருவாக்கப்படாத தரவை ஆய்வு செய்வது எந்திரங்களுக்கு எளிது. எதிர்காலத்தில், நமது தரவின் கணிசமான பகுதி உணர்விகளால் உருவாகும் வாய்ப்பு உள்ளது. உணர்விகள், சரியாக வடிவமைக்கப்பட்டால், தவறின்றி, சீராக தரவை உருவாக்கும் – மனிதர்களைப் போல அவ்வப்பொழுது தவறுகள் செய்யாது. ஆனாலும், மனிதர்கள், இந்த உணர்விகளால் உருவாக்கப்படும் தரவை விதவிதமாக ஆய்வு செய்து முடிவெடுக்க மனிதர்களையே நாடுவார்கள்.
இதனால், இத்துறைக்குப் பல்லாண்டுகள் எதிர்காலம் இருப்பது உண்மை. ஆரம்ப கட்டத்தில் இருக்கும் இத்துறையில் சாதிக்க பல வாய்ப்புகள் இன்றைய இளைஞர்களுக்கு இந்தத் துறை வழங்கும் என்பதில் சந்தேகமில்லை.