Monthly Archives: நவம்பர் 2014

Uncharted: Big Data as a Lens on Human Culture by Erez Aiden, Jean-Baptiste Michel

kim-kardashian-donut-Glazed_Break_The_Internet

ரஜினிகாந்த் குறித்து எத்தனை பேருக்குத் தெரியும்! என் பாட்டனார் தலைமுறையில் ஆரம்பித்து என்னுடைய பேத்தி தலைமுறை வரை எல்லோருக்குமே அறிமுகமான பெயர் – ரஜினி. ஆனால், திருவள்ளுவர் என்று சொன்னால், என் மகளுக்கே தட்டித் தடுமாறி, “இந்த வசனமாகப் பேசித் தள்ளும் சீரியல் படம் எல்லாம் எடுப்பாரே? ரெண்டு பொண்டாட்டி ‘ஒகே’ என்பாரே! அவரின் படத்தில் வருபவர்தானே?” என்பாள். திருவள்ளுவரைக் குறித்து எத்தனை புத்தகம் இருக்கும்? சூப்பர் ஸ்டாரைக் குறித்து எத்தனை புத்தகம் இருக்கும்?

எவர் காலத்தினால் அழியாமல் இருக்கிறார்? எப்படி ஆராயப்படுகிறார்? எவ்வாறு அந்தந்தக் காலத்தில் முக்கியமானவர் அறியப்படுகிறார்? எங்ஙனம் இவற்றை தெரிந்துகொள்வது?

இதுதான் இந்தப் புத்தகத்தின் மூலக்கரு. 1800களில் ஆரம்பித்து இதுகாறும் 130 மில்லியன் புத்தகங்களுக்கு மேல் வெளியாகி இருக்கிறது. தூரத்தில் இருப்பதைப் பார்ப்பதற்கு டெலஸ்கோப் இருக்கிறது. கிட்ட இருப்பதை நுண்மையாக நோக்குவதற்கு மைக்ரோஸ்கோப் இருக்கிறது. அதே போல் இந்த பதின்மூன்று கோடி நூல்களை எப்படி ஆராயலாம்? அவற்றில் சொல்லி இருக்கும் கலாச்சாரக் குறியீடுகளையும், அரசியல் நிலைப்பாடுகளையும், சரித்திர தகவல்களையும், பொருளாதார ஆராய்ச்சிகளையும் எப்படி வரலாற்றுப் பார்வையோடு கணினி துணையோடு அணுகுவது?

கூகுள் ஸ்காலர் நுழைகிறார். உலகின் மிகப் பெரிய நூலகமான ‘லைப்ரரி ஆஃப் காங்கிரஸி’ல் முப்பத்தி ஆறு மில்லியன் புத்தகம் இருக்கிறது. ஹார்வார்டு பல்கலை வாசகசாலையில் பதினேழு மில்லியன் புத்தகங்கள். இவற்றில் கிட்டத்தட்ட முப்பது மில்லியன் நூல்களை கூகிள், கணினி மூலம் கிடைக்க வகை செய்கிறது. இவற்றைக் கொண்டு, அதில் இருக்கும் வார்த்தைகளை அளக்க என் – கிராம் வசதியை கூகுள் தருகிறது.

அடக்குமுறையாக சமூகத்தில் சத்தமாகப் பேசுவோரின் குரல் மட்டுமே ஒலிக்குமா? நாஜி ஜெர்மனியில் மார்க் ஷகால் ஓவியங்களையும் பால் க்ளீ வரைபடங்களையும் பேசவிடாமால் வைத்திருந்தார்கள். கருத்துகளை மொத்தமாக ஜடமாக்கமுடிகிறது. ஒரே ஒரு சித்தாந்தத்தை மட்டுமே முழங்குபவர்களை கல்லூரிகளிலும் ஆட்சி பீடங்களிலும் வைத்திருந்தால் என்ன ஆகும் – என்பதைப் பார்க்க முடிகிறது. ஆனால், ஹிட்லர் வீழ்ந்த பின் இவர்களின் புகழ் பன்மடங்கு உயர்வதையும் பார்க்க முடிகிறது.

ரஷியாவின் ஸ்டாலின் ராஜாங்கம் இன்னும் மோசம். ஸ்டாலின் வீழ்ந்தபின்னும், அவரால் கொன்று குவிக்கப்பட்ட அரசியல் தலைவர்களின் பெயர்களும் சிந்தனாவதிகளின் சித்தாந்தங்களும் வெளிவரவே இல்லை. 1980களில் கம்யூனிசம் மொத்தமாக நொறுங்கிய பிறகே, அந்த மனிதர்களின் வாழ்க்கையையும் செயல்பாட்டையும் அறிய முடிகிறது.

அப்படியானால்… புத்தகங்களில் பிழையே இருக்காதா? ஒட்டுமொத்தமாக அலசினால் கூட ஆட்டுமந்தை சிந்தை வெளிப்படுவதை தடுக்க இயலாதா?

புகழ்பெற்ற ஜப்பானிய பழமொழியை எடுத்துக் கொள்வோம்: “ஓராயிரம் வார்த்தைகளால் சொல்வதை ஒரேயொரு படம் உணர்த்திவிடும்!” – இது ஜப்பானில் உதித்ததே அல்ல! அமெரிக்காவின் செய்தி ஆசிரியர் ஆர்த்தர் ப்ரிஸ்பேன் 1911ல் சொன்னது. இந்த மாதிரி மூல ஆராய்ச்சிகளை செய்யவும் எந்த வார்த்தை எப்பொழுது புழக்கத்திற்கு வந்தது என்பதை ஆராயவும் கூகுள் என்-கிராம் தேடுபொறி உதவுகிறது. அவற்றை எப்படி பயன்படுத்தலாம் என்னும் சிந்தனையை விசாலமாக்க இந்தப் புத்தகம் உதவுகிறது.

சரி… இவ்வளவு சொல்லியாகி விட்டது. கடந்த இரு நூற்றாண்டுகளின் அதிநாயகர்கள் எவர்?

  1. அடால்ஃப் ஹிட்லர்
  2. காரல் மார்க்ஸ்
  3. சிக்மன்ட் ப்ராய்ட்
  4. ரொனாலடு ரேகன்
  5. ஜோசஃப் ஸ்டாலின்
  6. விளாடிமிர் லெனின்
  7. ட்வைட் ஐஸனோவர்
  8. சார்லஸ் டிக்கன்ஸ்
  9. பெனிடோ முஸோலினி
  10. ரிச்சர்டு வாக்னர்

Fame is a bee.
It has a song—
It has a sting—
Ah, too, it has a wing.
– by Emily Dickinson

Uncharted_Big_data_As_lens_On_Human_Culture

Advertisements

Dataclysm: Who We Are (When We Think No One’s Looking) by Christian Rudder

Dataclysm Who We Are When We Think No Ones Looking Hardcover

புத்தகத்தை கிடுகிடுவென படித்துவிட முடிகிறது. ஏற்கனவே அரைத்த மசாலாவைப் போட்டு தமிழ் சினிமா எடுப்பது போல் சுவையாகவும் எளிமையாகவும் இருக்கிறது. மீண்டும் மீண்டும் வாசித்து, புதிய தரிசனங்களை, காலந்தோறும் சேமித்து வைக்கும் இரகசியங்களை எல்லாம் சொல்வதில்லை. மாலை நேரத்தில் சமீபத்தில் எம்.பி.ஏ முடித்த நண்பர் ஒருவருடன் நேர்ப்பேச்சு உரையாடல் போல் இலகுவான, ஆழ்ந்து பத்தி பத்தியாக வாசிக்க வேண்டாத நடை.

இந்தியாவின் பிக் பஜார் போல் அமெரிக்காவில் டார்கெட். தான் கருவுற்று இருக்கிறோமா என்பதை சோதிக்கும் சாதனத்தை பெற்றொருக்குத் தெரியாமல் பதின்ம வயது மகள் வாங்கிக் கொண்டு வீட்டிற்குப் போகிறாள். இரண்டே நாளில் அவருக்கு “தாய்மை”, “குழந்தை வளர்ப்பு” போன்ற பத்திரிகைகளுக்கு இலவச சந்தா கொடுக்கும் விளம்பரங்கள் முதல் ஆரோக்கியமான குழந்தை பிறக்க என்ன உட்கொள்ள வேண்டும் என்பதற்கான மாதிரி மருந்துகள் வரை, வந்து கொண்டேயிருக்கின்றன. பெற்றொருக்கும் பெண்ணின் இரகசிய கர்ப்பம் அம்பலமாகிறது.

அது போல் கூகுள் தேடலின் மூலம் ஜுரம் பரவுவதைக் கண்டுபிடிப்பது போன்ற பரவலாகப் பேசப்பட்ட தகவல்களையும் ஆராய்ச்சிகளையும்தான் புத்தகம் பேசுகிறது.

இளை தளபதி விஜய் பாஷையில் சொல்ல வேண்டுமானால், ‘இதயத்தை நம்பி முடிவெடுக்காமல், தகவலையும் அதன் மேற்சென்ற ஆய்வையும் வைத்து முடிவெடுப்பது என் விருப்பம்.’ இப்படிச் செய்தால் “நன்றாக அமையும்” என்று குருட்டாம் போக்கில் கடவுளை நம்பி காலை விடக் கூடாது. விரிவான தரவுகளை சேமிப்பது; அந்தத் தரவுகளின் நம்பகத்தன்மையை கூடிய மட்டும் அலசுவது; அந்தத் தரவுகளைக் கொண்டு தெளிவு அடைவது; தெளிந்த போக்குகளைக் கண்டு கொண்டு அறுவிதி அடைவது – இதுவே முறைமை.

1854ஆம் வருடம். லண்டனில் எங்கு பார்த்தாலும் காலரா நோய். இப்பொழுது எபோலா பரவி ஒபாமாவையும் அவருடைய டெமொகிராட் கட்சியையும் வீழ்த்த பயன்பட்டது மாதிரி, ஏதேனும் அரசியல் சதி இருக்குமோ என எல்லோரும் ஆராய்கிறார்கள். ஜான் மட்டும் வேறு மாதிரி ஆராய்கிறார். “நோய் எங்கே அதிகமாக காணப்படுகிறது?” கேம்ப்ரிட்ஜ் தெரு முக்கில் இருந்துதான் பெரும்பாலானோருக்கு நோய் வந்திருக்க வேண்டும் என அவருக்கு தரவுகள் தெரிவிக்கிறது.

ஆனால், அதே தெரு முக்கில் சிறைச்சாலை இருக்கிறது. அங்கிருக்கும் கைதிகளுக்கு காலெரா வரவில்லை. சாராயக்கடை உபாசகர்களுக்கும் காலரா வரவே இல்லை. ஏன்? மேலும் உள்ளே சென்று தீவிரமாக ஆராய்கிறார். சாராயக்கடையே கதியென இருப்பவர்கள், வேறு நீரை உட்கொள்ளவே இல்லை. அதே போல் ஜெயிலுக்கென்று பிரத்தியேகமாக கிணறு இருக்கிறது. அதனால்தான் அந்த இரு குழுக்களும் பாதுகாப்பாக காலரா நோயை தடுத்துவிட்டார்கள். அதே தெரு மக்களின் மூச்சுக் காற்றை சுவாசித்தாலும், நோய் தீண்டவே இல்லை.

இது போல் சுவாரசியமான விஷயங்களும் தற்கால ஆராய்ச்சிகளும் காதலில் விழுவதற்கான அட்டவணைகளும் இனக்கவர்ச்சிக்கான சூட்சுமங்களும் இதில் கிடைக்கிறது. உங்கள் மேலாளர் gut-feeling கொண்டு முடிவெடுப்பவராக இருந்தால், இந்தப் புத்தகத்தைப் பரிசளிக்கலாம்.