Skip to content
Home » ডেটা সাইন্স এর ভবিষ্যৎ কি? Python নাকি R দিয়ে শুরু করবো?

ডেটা সাইন্স এর ভবিষ্যৎ কি? Python নাকি R দিয়ে শুরু করবো?

    data science bangla tutorial
    Redirect Ads

    Forbes এর একটা জরিপ মতে, ২০৩০ সালের মধ্যে প্রায় ১৩টি জব সেক্টর পুরোপুরি অটোমেটেড হয়ে যাবে এবং World Economic Forum এর জরিপ থেকে ধারণা করা হয় অটোমেশন এর কারণে প্রায় ৭৫ মিলিয়ন জব ডিসপ্লেস হয়ে গেলেও মজার বিষয় হলো মোট প্রায় ১৩৩ মিলিয়ন নতুন জব জেনারেট করবে। তবে অটোমেশন এর কারণে কিছু নিম্ন এবং মধ্যম স্কিল এর জব অটোমেটেড করা সম্ভব হলেও কখনোই ডেটা সায়েন্স এর জব নস্ট করা সম্ভব নয়। অটোমেশন কেন ডেটা সাইন্স এর জবগুলো নস্ট করতে পারবে না সেটা বুঝতে চাইলে ডেটা সাইন্স কি এবং ডেটা সাইন্স ইকোসিস্টেম কিভাবে কাজ করে এটা বুঝতে হবে।

    তাহলে শুরুতে ডাটা সায়েন্স নিয়ে একটু ধারণা নেয়া উচিত। আমি যদি সবথেকে সহজ ভাষায় বলতে চাই তবে, ডাটা সায়েন্স হলো কয়েকটা বিষয় মিলে হাইব্রিড একটা বিষয় এবং ডাটা সায়েন্স যেসব বিষয়কে ফোকাস করে গঠিত সেগুলা হলো – পরিসংখ্যান, ফলিত গণিত এবং কম্পিউটার সায়েন্স।

    Download

    যেকোন জবকে আমরা তখনি লুক্রেটিভ বলে থাকি যখন এর মার্কেট ভ্যালু, জব স্যালারি, এবং ভবিষ্যত চাহিদা সবকিছুই অনেক ভালো থাকে। এবার তাহলে বুঝতে হবে ডাটা সায়েন্স বিষয়ক জব মার্কেট কেমন? এটা সত্যি যে বর্তমান যুগের সবথেকে লুক্রেটিভ জব গুলোর বেশিরভাগই ডাটা সায়েন্স এর ওপর ভিত্তি করে প্রতিষ্ঠিত।

    Glassdoor এর তথ্য অনুযায়ী আমেরিকায় একজন ডাটা সায়েন্টিস্ট তার অভিজ্ঞতা অনুসারে বছরে প্রায় $95k – $200k স্যালারি নিয়ে থাকেন। ডাটা সায়েন্স এর ওপর ভিত্তি করে যেসব জব পজিশন তৈরি হয়েছে যথাক্রমে – Machine Learning Engineer, Database Administrator, Data Architect, Data Engineer, Business Analyst, Data Analyst, Data Scientist, etc.

    তাহলে বাংলাদেশে চাহিদা কেমন? হ্যা, এটা সত্য ডাটা সায়েন্স রিলেভ্যান্ট জবের চাহিদা বাংলাদেশেও অনেক। তবে বাংলাদের প্রযুক্তির উন্নয়নের সাথে সাথে এর চাহিদা বেড়েই চলছে এবং ভবিষ্যতে চাহিদা আরও বাড়বে। বাংলাদেশের অনেক প্রাইভেট কোম্পানি তাদের বিজনেস গ্রোথ রেট বৃদ্ধি করার জন্য নতুন নতুন ডাটা সায়েন্স রিলেভ্যান্ট জব নিয়োগ দিচ্ছেন।

    আপনার হয়তো মনে প্রশ্ন জাগতে পারে বিজনেস গ্রোথ রেট বৃদ্ধি করার সাথে ডাটা সায়েন্স এর সম্পর্ক কি? হ্যা অবশ্যই আছে। আপনাকে একটা ছোট্ট উদাহরণ এর মাধ্যমে বিষয়টি পরিস্কার করছি—

    Download

    ধরুন আপনি ইউটিউবে সার্চ করলেন ‘python tutorial’ এটা সার্চ করার পরে হয়তো ইউটিউব আপনার হোমপেজে অনেকগুলো টিউটোরিয়াল সাজেশনে এনে দেবে এবং আপনি যখন একটা ভিডিও ক্লিক করার পরে কিছুক্ষণ দেখে হয়তো কেটে দেবেন। পরবর্তীতে যখনি আপনি ইউটিউবে যাবেন আশা করা যায় অন্য সব ভিডিওর পাশাপাশি কমপক্ষে ১-৩ টি পাইথন প্রোগ্রামিং এর ভিডিও হোমপেজে এনে দেবেই। তবে এর কারণ কি? আপনি যখন সার্চ করেছেন তখনি ইউটিউব বুঝতে পেরেছে আপনি Python এ ইন্টারেস্টেড। তাই পরবর্তীতে আপনার সামনে এই ধরনের ভিডিও সাজেস্ট করেছে।

    এখন মনে প্রশ্ন জাগা টা স্বাভাবিক যে এই কাজগুলো হয় কিভাবে? এটা নিয়ে বিস্তারিত আলোচনা করতে গেলে কথা বলতে হবে মেশিন লার্নিং, এনএলপি এবং ডাটা মাইনিং নিয়ে। ML, NLP, DM সবকিছুই ডাটা সায়েন্স এর সাবসেট বলতে পারেন। প্রতিটি বিষয় নিয়ে স্পেসিফিক ভাবে অন্য আরেকটা আর্টিকেলে কথা বলবো ইনশাআল্লাহ।

    ডাটা সায়েন্স শিখতে চাই। তবে কিভাবে শুরু করবো? এই প্রশ্নটা যেন প্রতিটি মানুষের একটা কমন প্রশ্ন। আমি আমার অভিজ্ঞতা থেকে কিছু টিপস শেয়ার করবো আশা করি নতুনদের জন্য অনেক উপকারে আসবে।

    প্রথমত, ডাটা সায়েন্স এ মাস্টার্স কোর্স করার মাধ্যমে শিখতে পারেন। সেটা সম্ভব না হলে অনলাইনে অনেক রিসোর্স রয়েছে। ধরুন আপনি আজ ঠিক করেছেন ডাটা সায়েন্স শিখতে চান। তবে আপনার করণীয় হলো প্রথমেই আপনাকে Python অথবা R Programming Language এর বেসিক ভালোভাবে শিখে নিতে হবে। এখানে এসে প্রায় ৮০%+ মানুষ কনফিউশানে থাকেন যে কোনটা দিয়ে শুরু করবো? উত্তর হলো আপনার যেটা ভালো লাগে।

    Download

    আমার মতে পাইথন প্রোগ্রামিং দিয়ে শুরু করাটা বেস্ট ডিসিশন। পাইথনের রিসোর্স ইউটিউবে ফ্রীতে পাবেন। Study Mart চ্যানেলে আপনি বাংলা ভাষায় খুব সুন্দরভাবে বেসিক পাইথন প্রোগ্রামিং শিখে নিতে পারেন অথবা ইংরেজিতে FreeCodeCamp, Krish Naik, Corey schafer, Telusko, Edureka, Coursera সহ আরও অনেক রিসোর্স রয়েছে।

    এবার আসি আমি R প্রোগ্রামিং এর কথা না বলে কেন Python এর কথা বললাম। সত্যি বলতে পাইথের সিনট্যাক্স মনে রাখা অনেকটা সহজ এবং আর এর থেকে পাইথনের রিসোর্স অনেক বেশি পাবেন। আপনি যখন ইমেজ, এনএলপি রিলেটেড কাজ কাজ করতে যাবেন আপনার পাইথনের কোন বিকল্প নেই। পাইথনের ওপর ভিত্তি করে ডিপ লার্নিং ফ্রেমওয়ার্ক যেমন Tensorflow or Pytorch এর মাধ্যমে খুব সহজেই এসব কাজ করতে পারবেন। Python এ রয়েছে Sklearn এর মতো মেশিন লার্নিং লাইব্রেরি। Numpy এর মতো মেট্রিক্স লাইব্রেরি, Pandas মতো ডাটাফ্রেম লাইব্রেরি যা এককথায় অসাধারণ।

    তবে R কোন দিক দিয়ে কম নয়। R এ রয়েছে ২৪০০+ পরিসংখ্যানের লাইব্রেরি এবং যার ৩০০০+ বিল্ড ইন ফাংশন। যার মাধ্যমে স্টাস্টিক্যাল এনালাইসিস করা খুবই সহজ। আপনি ভালো ডাটা সায়েন্টিস্ট হতে চাইলে পাইথন, আর দুইটা ভাষায় পারদর্শী হতে হবে। এবং পাশাপাশি MS Excel, SQL Database, SPSS, Weka আস্তে আস্তে শিখে নিতে হবে।

    যখন আপনার বেসিক পাইথন শেষ তারপরে আপনার করনীয় হলো NumPy, Pandas, Seaborn, Matplotlib সম্পর্কে মোটামুটি ধারণা নেয়া। কারণ প্রতিটি ডাটা সায়েন্স প্রজেক্টের প্রায় ৭০% সময় ব্যায় হয় ডাটা প্রিপ্রসেসিং এবং স্টাটিসটিক্যাল এনালাইসিসে। তাই আপনাকে কমপক্ষে Pandas এবং Seaborn ভালো জানতেই হবে। তারপরে আপনার কাজ আপনি আপনার মডেল ডেভেলপমেন্ট করার জন্য এলগরিদম সিলেকশন করা।

    Download

    যেহেতু আপনি Python দিয়ে শুরু করবেন তাই আপনি প্রয়োজনীয় সকল এলগরিদম পাবেন সাইকিট লার্ন এর মধ্যে। সবকিছু শেখার জন্য আপনার জন্য বেস্ট রিসোর্স হতে পারে study mart এর পাইথন প্লেলিস্ট। সেখানে বাংলা ভাষায় সবকিছু সুন্দর করে স্টেপ বাই স্টেপ দেখানো হয়েছে। আর ইংরেজিতে রিসোর্স হিসেবে Coursera, MIT OpenCourseWare, Krish Naik, Edureka etc. ফলো করতে পারেন।

    মেশিন লার্নিং শেষ করে আপনি শুরু করবেন ডিপ লার্নিং এবং তারপর এন,এল,পি। এখানেও আপনি ওপরের রিসোর্সগুলো ফলো করতে পারেন। আর বলে রাখা ভালো আপনি যদি একজন দক্ষ ডাটা সায়েন্টিস্ট হতে চান Kaggle এর কোন বিকল্প নেই। এছাড়াও Kaggle এ পাবেন প্রাকটিস করার জন্য ফ্রী ডাটাসেট এবং কম্পিটিশনে অংশগ্রহন করে জিতে নিতে পারেন পুরস্কার হিসেবে হাজার হাজার ডলার। বাকি কথা অন্য কোন আরটিকেল এ বলবো।

    লিখেছেনঃ
    Rashedul Alam Shakil
    B.Sc. in CSE, DIU
    Masters in Data Science,
    Friedrich–Alexander University, Germany

    বইয়ের ফেরিওয়ালায় আপনার লেখা প্রকাশ করতে চাইলে এইখানে লেখা জমা দিন।

    ইউটিউবে বইয়ের ফেরিওয়ালার বুক রিভিউ পেতে সাবস্ক্রাইব করুন

    Facebook Comments
    x
    error: লেখা নয়, লিঙ্কটি কপি করুন