Skip to content

ഒരു സമ്പൂർണ മലയാള മെഷീൻ ലേർണിംഗ് ഗൈഡ്

Notifications You must be signed in to change notification settings

sreeram-venkitesh/Essence-of-ML

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

40 Commits
 
 
 
 
 
 

Repository files navigation

എസ്സെൻസ് ഓഫ് മെഷീൻ ലേർണിംഗ്

നമ്മൾ ഇപ്പോൾ എന്നും കേക്കാറുള്ള വാക്കുക്കൾ ആണ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഉം മെഷീൻ ലേർണിംഗ് ഉം ഒക്കെ. പക്ഷെ ശെരിക്കും എന്താണ് ഈ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ്? ഒരു പക്ഷെ നമ്മൾ എല്ലാരും തന്നെ ഈ കോൺസെപ്റ്റിനെ പറ്റി ആദ്യമായി കേൾക്കുന്നത് സിനിമകളിൽ നിന്നുമായിരിക്കും. ടെർമിനേറ്റർ തൊട്ട് അവേഞ്ചേഴ്‌സ് മുതൽ നമ്മുടെ സ്വന്തം ചിട്ടി വരെ ഉണ്ട് AI. മിക്കവാറും എല്ലാ സിനിമകളിലും തന്നെ AI ചിത്രീകരിക്കപെട്ടിരിക്കുന്നത് ലോകം കൈയടക്കാൻ ശ്രമിക്കുന്ന ഒരു വില്ലൻ റോബോട്ട് ആയിട്ടാണ്. അതുകൊണ്ട് തന്നെ നമ്മളുടെ കാഴ്ചപാട് ഭാവിയിൽ എങ്ങോ വരാൻ ഇരിക്കുന്ന എന്തോ ആണ് AI എന്നാണ്.

AI ഇപ്പോൾ തന്നെ നമ്മുടെ ചുറ്റും ഉണ്ട് എന്നതാണ് യാഥാർഥ്യം. നമ്മൾ ഈ ലോകത്തെ എങ്ങനെ കാണുന്നു എന്നും നമ്മൾ എങ്ങനെ ചിന്തിക്കുന്നു എന്നും ഒക്കെ തീരുമാനിക്കുന്നതിൽ AI വളരെ വലിയൊരു പങ്ക് ഇപ്പോൾത്തന്നെ വഹിക്കുന്നുണ്ട്. ഇമെയിൽ സ്പാം ഫിൽറ്ററുകൾ മുതൽ യൂട്യൂബ് റെക്കമെൻഡേഷനുകൾ വരെ എല്ലാം മനുഷ്യനേക്കാൾ വൃത്തിയായിട്ടു ഇപ്പോൾ യന്ത്രം സ്വയമേവ ചെയ്യും.

മെഷീൻ ലേർണിംഗിന്റെ ഒരു ഓപ്പൺ-സോഴ്സ് ടെക്ക്സ്റ്ബുക് എന്നതാണ് ഞങ്ങളുടെ ഈ ശ്രമത്തിന്റെ ലക്ഷ്യം. നിങ്ങളുടെ മുൻപരിചയം കണക്കിലെടുക്കാതെ, പ്രോഗ്രാമർ ആയാലും അല്ലെങ്കിലും, എല്ലാവര്ക്കും മനസിലാവുന്ന രീതിയിൽ മെഷീൻ ലേർണിംഗിന്റെ പുറകിൽ ഉള്ള കളികൾ മലയാളത്തിൽ പരിചയപ്പെടുത്തുന്ന ഒരു ഗ്രന്ഥം.

ഇങ്ങനെ ഒരു റീപോ തുടങ്ങാൻ ഉള്ള കാരണങ്ങളിൽ ഒന്ന് ലാക്ക് ഓഫ് റിസോഴ്‌സസ് ആണ്. ഓരോ ദിവസവും പുതിയ ടെക്നോളജികൾ വരുന്നു. ഇന്ന് ഇപ്പോൾ ഇൻറർനെറ്റിൽ തപ്പിയാൽ മെഷീൻ ലേർണിംഗ്, ബ്ലോക്ക് ചെയിൻ പോലുള്ള പുതിയ ഫീൽഡ്സ് ഓഫ് സ്റ്റഡികളെ കുറിച്ച ധാരാളം പഠന സാമഗ്രികൾ വിരൽ തുമ്പിൽ തന്നെ കിട്ടും. പക്ഷെ എന്നിരുന്നാലും മലയാള ഭാഷയിൽ എഴുതീട്ടുള്ള ഒന്നും തന്നെ ഇല്ല!


ഉള്ളടക്കം


ആമുഖം

ജാർഗൺ ബസ്റ്റിംഗ്

ഇന്റർനെറ്റ് തുറന്ന് പഠിക്കാൻ ഇരിക്കുമ്പോൾ അതാ കൊറേ കടിച്ച പൊട്ടാത്ത വാക്കുക്കൾ! ഇതിന്റെയെല്ലാം അർഥം എന്താണ്! മെഷീൻ ലീർണിങ്, ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ്, ദീപ് ലീർണിങ്, ന്യൂറൽ നെറ്വർക്സ്, ... ഈ ലിസ്റ്റ് ഇങ്ങനെ അങ്ങ് നീണ്ടു പോവും...

പലരുടെയും വാശിയേറിയ പഠനം നിന്ന് പോയത് ഇവിടെ വെച്ചാവും. സ്കൂളിലും കോളേജിലും ഒക്കെ ഡെഫിനിഷൻ പഠിച്ചു പോവുന്നത് പോലെ അല്ലാതെ ഇവയുടെയൊക്കെ പുറകിലുള്ള അടിസ്ഥാനം എന്താണെന്നു മനസിലാക്കിയാൽ വളരെ എളുപ്പമായി തോന്നും.

നിങ്ങൾ ഒരു വല്യ സദ്യ ഉണ്ണാനായി ഇരികുകയാണെന്ന് കരുതുക. പക്ഷെ നിങ്ങളുടെ ഇലയിൽ അവിയൽ മാത്രമേ വന്നിട്ടുള്ളൂ! വിചിത്രമായ സദ്യ തന്നെ! ബാക്കി ഉള്ള ഇനങ്ങൾ വരുന്നതേ ഉള്ളു! ഈ അവിയലിൽ ആവട്ടെ നിങ്ങൾ നോക്കുമ്പോൾ എടുത്തു കാണുന്നത് മുരിങ്ങകോലുകൾ മാത്രം!സ്

ഇനി നമുക്ക് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിനെ കുറിച്ച പൊതുവായിട്ട് മിണ്ടാം. മനുഷ്യൻ ചക്രം കണ്ടുപിടിച്ച കാലം മുതൽ പിന്നെ അങ്ങോട്ട് വളർച്ചയും പുരോഗതിയും മാത്രമേ ഉണ്ടായിട്ടുള്ളൂ. ഇന്ന് ഇപ്പോൾ നമ്മൾ കൃത്രിമ മനുഷ്യരെ വരെ ഉണ്ടാക്കി തുടങ്ങി. ഭാവിയിൽ ഒരാൾ മനുഷ്യൻ ആണോ അതോ യന്ത്രമനുഷ്യൻ ആണോ എന്ന നമ്മൾക്ക് തിരിച്ചറിയാൻ കഴിയാത്ത ഒരു കാലത്തെ കുറിച്ച സയൻസ് ഫിക്ഷൻ എഴുതുകാർ ഭാവനയിൽ കണ്ടിട്ടുണ്ട്. അങ്ങനെ ഒരു കാലം അധികം ദൂരെയല്ല. മനുഷ്യനെ പോലെ ചിന്തിക്കുന്നതും, ചുറ്റുമുള്ളതു കാണാനും മനസിലാക്കാനും അതിന്റെ അടിസ്ഥാനത്തിൽ തീരുമാനങ്ങൾ എടുക്കാനും കഴിവുള്ളതും ആയ മനുഷ്യൻ നിർമിക്കുന്ന എന്തും എന്ന് വേണമെങ്കിൽ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിനെ ഡിഫൈൻ ചെയ്യാം.

ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിനെ മൂന്നായിട്ട് തിരിക്കാം.

  1. നാരോ AI,
  2. ആർട്ടിഫിഷ്യൽ ജനറൽ ഇന്റലിജൻസ്,
  3. സ്ട്രോങ്ങ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ്.

നാരോ AI ആണ് ഇപ്പോൾ നമ്മൾ സാധിച് എടുത്തിട്ടുള്ളത്. നാരോ എന്ന് വെച്ചാൽ ഒരു പ്രതേക കാര്യം കാര്യക്ഷമമായി ചെയ്യാൻ ഉള്ള കഴിവുള്ള ഒരു മനുഷ്യ സൃഷ്ഠി. ഉദാഹരണമായി ഇമെയിൽ സ്പാം ഫിൽറ്ററുകളെ എടുക്കാം. ഒരിക്കൽ പറഞ്ഞു കൊടുത്താൽ മനുഷ്യന് ചെയാവുന്നതിനേക്കാൾ ഭംഗിയായി നമ്മുടെ AI ആ പണി ചെയ്യും. നന്നായിട്ട് ചെയ്യുമെങ്കിലും നാരോ AI പറഞ്ഞ ആ ഒന്നോ രണ്ടോ പണി മാത്രമേ ചെയുള്ളു. നാരോ AI സ്വന്തമായി ചിന്തിക്കുന്നുണ്ട് എന്ന് നമുക്ക് തോന്നുമെങ്കിലും, സ്വന്തമായി ചിന്തിച്ചു ചെയ്‌യുന്നത് പോലെ അതിനു പുറകിൽ ഉള്ള കണക്കുകൾ നമ്മളെ തോന്നിപ്പിക്കുന്നതാണ്. സത്യത്തിൽ നാരോ AI-ക്ക് ചിന്തിക്കാൻ ഉള്ള കഴിവ് ഇല്ല.

ആർട്ടിഫിഷ്യൽ ജനറൽ ഇന്റലിജൻസ് എന്നാൽ ഒരു മനുഷ്യന് ചെയ്യാൻ കഴിയുന്ന എല്ലാ കാര്യങ്ങളും കാര്യക്ഷമമായി ചെയ്യാൻ കഴിയുന്ന ഒന്നാണ്. നമ്മളെ സിനിമകളിൽ കണ്ടിട്ടുള്ള പേർസണൽ അസിസ്റ്റന്റ് റോബോട്ടുകൾ എല്ലാം ഈ ഗണത്തിൽ പെടുന്നവയാണ്. ആർട്ടിഫിഷ്യൽ ജനറൽ ഇന്റലിജൻസ് ഇന്റെ കീഴിൽ വരുന്നതിനെല്ലാം സ്വന്തമായി ചിന്തിക്കാൻ ഉള്ള കഴിവുണ്ട്. നമ്മള് ഇതുവരെ ആർട്ടിഫിഷ്യൽ ജനറൽ ഇന്റലിജൻസ് സാധിച്ചെടുത്തിട്ടില്ല. ഈ ഫീൽഡിൽ ഇപ്പോഴും ഗവേഷണം നടന്നുകൊണ്ടിരിക്കുകയാണ്.

സ്ട്രോങ്ങ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് എന്ന് വെച്ചാൽ മനുഷ്യൻ ചെയുന്ന എല്ലാ കാര്യങ്ങളും മനുഷ്യനേക്കാൾ കാര്യക്ഷമമായി ചെയ്യാൻ കഴിയുന്ന AI. സിനിമകളിൽ കാണുന്ന 'ലോകം കൈയടക്കാൻ ശ്രമിക്കുന്ന റോബോട്ടുകളെ' ഇതിൽ ഉൾപ്പെടുത്താം. എന്നുവെച്ചു എല്ലാ സ്ട്രോങ്ങ് AI യും ക്രൂരന്മാർ ആണെന്നില്ലാ. മനുഷ്യൻ്റെ കൂടെ തന്നെ നിന്ന് മനുഷ്യനേക്കാൾ നല്ലരീതിയിൽ കാര്യങ്ങൾ ചെയ്യാൻ കഴിയുന്നതാവും സ്ട്രോങ്ങ് AI-ക്ക്.

ഇതിൽ ഇപ്പോൾ നമ്മളെ ചെയ്തിട്ടുള്ളതും നമ്മള് ഉപയോഗിക്കുന്നതായിട്ടും ഉള്ളത് നാരോ AI മാത്രമാണ്. (ബാക്കി രണ്ടും ഗവേഷണത്തിന്റെ ഏരിയ ആണ്). നാരോ AI എങ്ങനെ ആണ് നമ്മളെ സാധിച്ച എടുത്തിട്ടുള്ളത് എന്നതിനുള്ള ഉത്തരമാണ് മെഷീൻ ലേർണിംഗ്.

ഇനി നമ്മൾ കഴിച്ച സദ്യയിലേക്ക് തിരിച്ചു പോവാം. നമ്മൾക്കു വെച്ചിരിക്കുന്ന ഇല ആണ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ്. ആർട്ടിഫിഷ്യൽ ജനറൽ ഇന്റലിജൻസ് ഉം സ്ട്രോങ്ങ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് ഉം വരുന്നതേ ഉള്ളു. നമ്മുക്ക് നാരോ AI ആയി ഇലയിൽ ഉള്ളത് മെഷീൻ ലേർണിംഗ് ആണ്.

ഇനി ഇപ്പൊ മെഷീൻ ലേർണിംഗ് എന്ന വെച്ചാൽ എന്താണ്? മെഷീനിനെ പ്രോഗ്രാം ചെയ്യാതെ തന്നെ മെഷീൻ സ്വന്തമായി കാര്യങ്ങൾ മനസിലാക്കി പഠിക്കുന്നതിനു ആണ് മെഷീൻ ലേർണിംഗ് എന്ന പറയുന്നത്. എങ്ങനെ പഠിക്കണം എന്ത് പഠിക്കണം എന്ന് നമ്മൾ ആദ്യം പറഞ്ഞുകൊടുക്കേണ്ടി വരുമെന്നു മാത്രം. അതിനു ശേഷം ബാക്കി എല്ലാ കാര്യങ്ങളും, ഉദാഹരണത്തിന്, നിത്യം മാറിക്കൊണ്ടിരിക്കുന്ന ചുറ്റുപാടുകളിൽ നിന്നും സ്വന്തമായി തീരുമാനങ്ങൾ എടുക്കാൻ ഉള്ള കഴിവ് ഒരു മെഷീൻ ലേർണിംഗ് മോഡലിന് ഉണ്ട്. ഇമെയിൽ സ്പാം ക്ലാസ്സിഫൈർ ആണ് നമ്മൾ ഉണ്ടാക്കുന്നതെങ്കിൽ, നമ്മൾ എഴുതുന്ന പ്രോഗ്രാം ആണ് മോഡൽ. ഏതൊരു മോഡലിനെയും ആദ്യം ട്രെയിൻ ചെയ്യണം. ട്രെയിൻ ചെയ്യാനായി നമ്മൾ കൊറേ അധികം ടാറ്റ വെച്ച് നമ്മുടെ മോഡലിനെ ആദ്യം സ്പാം ഇമെയിൽ എന്താന്നെന്നു "പഠിപ്പിക്കും". അതിനു ശേഷം ഏത് ടെസ്റ്റ് ടാറ്റ കൊടുത്താലും നമ്മുടെ മോഡൽ ട്രെയിനിങ് ഡാറ്റയിൽ നിന്ന് പഠിച്ചത് വെച്ച് ടെസ്റ്റ് ഡാറ്റയിൽ ഉള്ള ഇമെയിലുകൾ സ്പാം ആണോ അല്ലയോ എന്ന പ്രവചിക്കും. ഈ മോഡൽ എന്താണെന്നും ട്രെയിനിങ് ഉം ടെസ്റ്റിംഗ് ഉം ഒക്കെ എങ്ങനെ ചെയാം എന്നും നമ്മൾ തുടർച്ചെയുള്ള ചാപ്റ്ററുകളിൽ കാണും.

മെഷീൻ ലേർണിംഗ് ഇലെ മോഡലുകൾ എഴുതാനും ട്രെയിൻ ചെയ്യാനും ഒക്കെ പല വഴികൾ ഉണ്ട്. നമ്മൾ എന്താണോ ചെയ്യാൻ ഉദ്ദേശിക്കുന്നതനുസരിച് ഇരിക്കും നമ്മുടെ മോഡൽ എങ്ങനെ ഡിസൈൻ ചെയ്യണം എന്നത്. ബേസിക് ആയിട്ടുള്ള മെഷീൻ ലേർണിംഗ് ടാസ്‌ക്‌സിൽ ഉൾപ്പെടുന്നത് റിഗ്രെഷൻ, ക്ലാസ്സിഫിക്കേഷൻ എന്നിവയൊക്കെയാണ് (റിഗ്രെഷൻ എന്നാൽ ഒരു തുടർച്ചയായി മാറുന്ന ഒരു അളവിനെ പ്രവചിക്കുന്നതും, ക്ലാസ്സിഫിക്കേഷൻ എന്നാൽ ഓരോ ഇന്പുട് കേസിനെയും വ്യത്യസ്തമായ ഓരോ വിഭാഗങ്ങളിലേക് തിരിക്കുന്നതും ആണ്). മെഷീൻ ലേർണിംഗിനെ കുറിച്ചും വിവിധ തരം മെഷീൻ ലേർണിംഗുകളെ കുറിച്ചും അടുത്ത ചാപ്റ്ററിൽ പഠിക്കാം.

ഇതിപ്പോ ഇവിടെ പറയാൻ കാരണം നമ്മുടെ അവിയലിലെ കഷ്ണങ്ങളെ പരിചയപെടുത്താൻ വേണ്ടി ആണ്. മെഷീൻ ലേർണിംഗ് എന്ന അവിയലിൽ കുറെ അധികം കഷ്ണങ്ങൾ ഉണ്ട്. ഇതിൽ ഉൾപ്പെടുന്ന ക്യാററ്റും ബീന്സും ഒക്കെ ആണ് റിഗ്രെഷനും ക്ലാസ്സിഫിക്കേഷനും ഒക്കെ. പക്ഷെ അതിൽ എടുത്തു നിൽക്കുന്നത് മുരിങ്ങാക്കോൽ ആണ്. ഈ മുരിങ്ങാക്കോൽ ആണ് ഡീപ് ലേർണിംഗ്. ഡീപ് ലെർണിങ്ങ് എന്നത് മെഷീൻ ലേർണിംഗിന്റെ ഒരു വക ഭേദമായി കാണാം. ന്യൂറോണുകൾ ഉപയോഗിച്ച് മേൽ പറഞ്ഞ എല്ലാ ടാസ്‌ക്‌സും വളരെ അധികം അക്ക്യൂറസിയോടെ എളുപ്പം ചെയാം. ന്യൂറോണുകളെ ഒരു വല പോലെ അങ്ങോട്ടും ഇങ്ങോട്ടും ബന്ധിപ്പിച്ചാൽ ഒരു ന്യൂറോൺ വല ആയി.

ഇന്ന് മെഷീൻ ലേർണിംഗ് ഇത്ര പോപ്പുലർ ആവാനുള്ള കാര്യം തന്നെ ഈ ന്യൂറോൺ വലകളുടെ അതി ഗംഭീരമായ അക്ക്യൂറസി കൊണ്ടാണ്. ഇമേജ് പ്രോസസ്സിങ്ങും, മുഖം-തിരിച്ചറിയൽ (ഫേഷ്യൽ റെക്കഗ്നിഷൻ) ഒക്കെ അനായാസം ന്യൂറോൺ വലകൾ കൊണ്ട് പറ്റും. വഴിയേ ഉള്ള ചാപ്റ്ററുകളിൽ നമ്മൾ ന്യൂറോണുകളെ പറ്റിയുള്ള വിശദമായ വിശകലനം നടത്താം. ഇപ്പോൾ മനസ്സിലായിക്കാണുമല്ലോ എന്തുകൊണ്ടാണ് അവിയലിലെ മുരിങ്ങാക്കോൽ ഡീപ് ലെർണിങ്ങ് ആയതെന്ന്!

Chapter 1 : വിവിധ തരം മെഷീൻ ലേർണിംഗ്

ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് എന്താണെന്നും അതിനുള്ളിൽ മെഷീൻ ലേർണിംഗ് ഉം ഡീപ് ലേർണിംഗ് ഉം എവിടെയാണെന്നും ഇപ്പോൾ ഒരു ഐഡിയ കിട്ടികാണുമല്ലോ. ഇനി നമുക് മെഷീൻ ലേർണിംഗിലേക്ക് വിശദമായിട്ട് കടക്കാം. മെഷീൻ ലേർണിംഗ് എന്ന വാക് കൊണ്ട് ഉദ്ദേശിക്കുന്നതെന്താണ്? ഒരു മെഷീൻ സ്വന്തമായി പഠിക്കുന്നു.

അടിസ്ഥാനപരമായി ഒരു മോഡൽ എന്നാൽ എന്താണ്? ഒരു മെഷീൻ ലേർണിംഗ് മോഡൽ എന്താണ് ചെയുന്നത്? ഒരു മോഡൽ എഴുതുന്നതു കൊണ്ട് നമ്മൾ എന്താണ് നേടി എടുക്കാൻ ശ്രമിക്കുന്നത്? അല്ലെങ്കിൽ എന്തെല്ലാം തരം പ്രശ്നങ്ങൾ നേരിടാനാണ് മെഷീൻ ലേർണിംഗ് ഉപയോഗകരമാവുക?

മെഷീൻ ലേർണിംഗിന്റെ വ്യാഖാനം തന്നെ മനുഷ്യൻ പ്രോഗ്രാം ചെയ്യാതെ സ്വയമേവ പഠിക്കുന്ന യന്ത്രം എന്നാണല്ലോ. മനുഷ്യന്റെ മേൽനോട്ടത്തോടുകൂടിയോ അല്ലാതെയോ ആവാം മെഷീനിന്റെ ഈ പഠനം.

മെഷീൻ ലേർണിംഗ് മോഡലുകളെ അവയെ മേൽനോട്ടം വഹിക്കുനുണ്ടോ ഇല്ലയോ എന്ന് വെച്ച തരം തിരിക്കാം.

1 . മേൽനോട്ടമുള്ള ലേർണിംഗ് (സൂപ്പർവൈസ്ഡ് ലേർണിംഗ്)

2 . മേൽനോട്ടമില്ലാത്ത ലേർണിംഗ് (അൺ - സൂപ്പർവൈസ്ഡ് ലേർണിംഗ്)

മേൽനോട്ടത്തോട് കൂടിയുള്ള ലേർണിംഗ് എന്നാൽ മനുഷ്യൻ്റെ സഹായത്തോടെ ഒരു മോഡൽ സ്വയമേവ പഠിക്കുന്നു. നിങ്ങൾ ഒരു ഈമെയിൽ സ്പാം ആണോ അല്ലയോ എന്ന് തരംതിരിക്കാൻ ഒരു മോഡൽ നിർമിക്കുകയാണെന്ന് കരുതുക. ഇതിൽ എങ്ങനെ ആവും മനുഷ്യന്റെ സ്വാധീനം വരുക? മനുഷ്യ സഹായം വേണ്ടിയെ വരുമോ?

സൂപ്പർവൈസ്ഡ് ലേർണിംഗിൽ നമ്മൾ മെഷീനിനെ ട്രെയിൻ ചെയ്യാൻ, അതായത് "പഠിപ്പിക്കാൻ" ഉപയോഗിക്കുന്ന ഡാറ്റാസെറ്റിൽ ഇൻപുട്ട് ആയിട്ടുള്ള ഫീച്ചേഴ്സും ഔട്ട്പുട്ട് ആയിട്ടുള്ള ഒരു ലേബലും ആണ്. ഇമെയിൽ സ്പാം ക്ലാസ്സിഫൈയറിൽ ഇൻപുട്ട് ഫീച്ചേഴ്സ് ആയി വരുന്നത് ഇമെയിൽ തലകെട്ടിൽ വരുന്ന വാക്കുകളും, അതിന്റെ പാരഗ്രാഫുകളുടെ എണ്ണവും അതിലുള്ള വാക്കുകളും ഒക്കെ ആയിരിക്കും. കാരണം ഒരു ഇമെയിൽ സ്പാം ആണോ എന്ന് നിങ്ങൾ മനസിലാക്കുന്നത് അതിന്റെ തലക്കെട്ടിലേയും ബോഡിയിലെയും വാക്കുകളും അതിലുള്ള വമ്പൻ ഓഫറുകളും ഒക്കെ കാണുബോൾ അല്ലെ? ഇതേ ഫീച്ചേഴ്സ് തന്നെയാണ് നമ്മുടെ മോഡലും ഉപയോഗിക്കുന്നത് ഇമെയിൽ സ്പാം ആണോ അല്ലെയൊന്ന് കണ്ടുപിടിക്കാൻ.

ഔട്പുട്ടിലെ ലേബലുകൾ ഈമെയിൽ ഇന്റെ കേസിൽ 2 തരം ആയിരിക്കും. സ്പാം ഇമെയിലും സ്പാം അല്ലാത്ത ഇമെയിലും.

നമ്മുടെ ട്രെയിനിങ് ഡാറ്റാസെറ്റിലെ ആയിരകണക്കിന് ഇമെയിലുകളും അവരുടെ ലേബലും ഉപയോഗിച്ച മോഡൽ എന്താണ് സ്പാം ഇമെയിൽ എന്നും ഒരു ഇമെയിൽ സ്പാം ആവണമെങ്കിൽ അതിന്റെ ഫീച്ചേഴ്സ് എന്തൊക്കെയാവണമെന്നും, ഇമെയിൽ സ്പാം ആവുന്നതിന്റെ ആ മിനിമം ത്രെഷോൾഡ് എന്താണെന്നും ഒക്കെ പഠിക്കും. ഇതുപയോഗിച്ചു ഭാവിയിൽ കാണുന്ന ഇമെയ്‌ലുകളെ, അവയുടെ ലേബൽ ഇല്ലെങ്കിലും, കൃത്യമായി കണ്ടുപിടിക്കും.

പക്ഷെ ഇത് തരംതിരിക്കലിന്റെ ഉദാഹരണമല്ലേ? ഇവിടെ ഔട്ട്പുട്ട് ലേബലുകൾക്കു എടുക്കാവുന്ന വാല്യൂ ആകെ രണ്ടെണ്ണമേ ഒള്ളു. സ്പാം അല്ലെങ്കിൽ സ്പാം അല്ലാത്തത്. പക്ഷെ നമുക്ക് വേണ്ട ലേബലുകൾ റിയൽ നമ്പർ ലൈനിലെ ഒരു റേഞ്ച് ഓഫ് വാല്യൂസ് ആണെങ്കിലോ?

ഉദാഹരണത്തിന് നിങ്ങൾ കൊച്ചിയിൽ ഒരു വീട് വാങ്ങിക്കാൻ നോക്കുക്കയാണെന്നു വിചാരിക്കുക. ഇൻപുട്ട് ഫീച്ചേഴ്സ് ആയി വരുന്നത് വീടിന്റെ ഓരോ ഡീറ്റെയിൽസ് ആവാം. വീടിന്റെ ചതുരശ്ര അടിയിലുള്ള വിസ്തീർണം, ബെഡ്‌റൂമുകളുടെ എണ്ണം, നിലകളുടെ എണ്ണം അങ്ങനെ അങ്ങനെ. ഔട്ട്പുട്ട് ലാബിലുകളായി വരുന്നത് വീടിന്റെ വിലയാണ്. വീടിന്റെ വില 20 ലക്ഷം മുതൽ 70 ലക്ഷം വരെയുള്ള ഒരു റേഞ്ച് ആണ്. ഇതിനിടയിൽ ഏത് വേണമെങ്കിലും ആവാം, നിങ്ങളുടെ വീടിന്റെ ഫീച്ചേഴ്സ് അനുസരിച്.

Chapter 2 : റിഗ്രെഷൻ

ഉദാഹരണങ്ങൾ വെച്ച പഠിക്കുമ്പോൾ ഓരോന്നിന്റെയും പുറകിൽ ഉള്ള അടിസ്ഥാനം മനസിലാകാൻ എളുപ്പം ആവുമല്ലോ. നിങ്ങൾ കൊച്ചിയിൽ ഒരു വീട് വാങ്ങാൻ തീരുമാനിച്ചു എന്ന് വിചാരിക്കുക. നിങ്ങള്ക്ക് ഉദ്ദേശിക്കുന്ന വീടിന്റെ വില എത്രയാവുമെന്നു അറിഞ്ഞാൽ കൊള്ളാം. നിങ്ങള്ക്ക് ആകെ അറിയാവുന്നത് വീടിന്റെ ചതുരശ്ര അടിയിലുള്ള വിസ്തീർണം കൂടുതനൗസരിച് വീടിന്റെ വിലയും കൂടും എന്ന മാത്രമാണ്.

നിങ്ങളുടെ സുഹൃത്തായ ബ്രോക്കർ ശശിയോട് നിങ്ങൾ ഇതിനെ കുറിച്ച് സംസാരിച്ചു. ശശിയുടെ വർഷങ്ങളായുള്ള വൈദഗ്ധ്യം കൊണ്ട് 10 മുതൽ 500 വരെ ഉള്ള എല്ലാ ചതുരശ്ര അടിയുള്ള വീടുകളുടെയും വില ശശി നിങ്ങൾക്കു തന്നു. ഇതിൽ നിന്ന് നിങ്ങൾക്കു വേണ്ട വിസ്തീർണം ഉള്ള വീടിന്റെ വില കണ്ടുപിടിക്കണം. പക്ഷെ ശശി തന്നിട്ടുള്ള ഡാറ്റയിൽ നിങ്ങള്ക്ക് വേണ്ട കൃത്യമായ വിസ്തീർണത്തിന്റെ വില ഇല്ല. അപ്പോൾ എന്ത് ചെയ്യും? ശശി തന്ന ടാറ്റ മൊത്തം വെറുതെ ആയോ?

Chapter 3 : തരംതിരിക്കൽ (ക്ലാസ്സിഫിക്കേഷൻ)

Chapter 4 : കൃത്രിമ ന്യൂറൽ വലകൾ (ആർട്ടിഫിഷ്യൽ ന്യൂറൽ നെറ്വർക്സ്)

നമ്മൾ ഇത്രയും നേരം മിണ്ടികൊണ്ടിരുന്ന മെഷീൻ ലെർണിങ്ങിൽ നിന്നും കുറച്ചു വ്യത്യസ്തമായ ഒരു ടോപ്പിക്കിലേക്ക് കടക്കാം. നമ്മുടെ തലച്ചോറിൽ ഉള്ള സെല്ലുകളെ ന്യൂറോണുകൾ എന്നാണ് വിളിക്കുന്നത്, പരസ്പരം ബന്ധിപ്പിച്ച ന്യൂറോണുകളുടെ ഒരു വലിയ വലയാണ് നമ്മുടെ തലച്ചോറിലെ ഭൂരിഭാഗവും.

About

ഒരു സമ്പൂർണ മലയാള മെഷീൻ ലേർണിംഗ് ഗൈഡ്

Resources

Stars

Watchers

Forks

Packages

No packages published