বড় উপাত্ত
বৃহদায়তন উপাত্ত / From Wikipedia, the free encyclopedia
বড় উপাত্ত বা বিগ ডেটা (ইংরেজি: Big Data) হচ্ছে ডাটা সেট যা এতই বৃহদাকার এবং জটিল যে গতানুগতিক ডাটা প্রক্রিয়াকরণ অ্যাপ্লিকেশন সফ্টওয়্যার মোকাবেলা করার জন্য যা অনুপযুক্ত। বিগ ডাটা চ্যালেঞ্জের মধ্যে অন্তর্ভুক্ত হচ্ছে ডাটা ক্যাপচারিং, কম্পিউটার মেমরি, তথ্য সংরক্ষণ, তথ্য বিশ্লেষণ, সার্চ, শেয়ারিং, স্থানান্তর, কল্পনা, জিজ্ঞাসা, হালনাগাদ করা এনং তথ্য গোপনীয়তা। বিগ ডাটার ৫ টি মাত্রা রয়েছেঃ আয়তন, বিভিন্নতা, বেগ এবং সম্প্রতি যোগকৃত ভারসাম্য এবং মান।[2]
বড় উপাত্ত শব্দটির বর্তমান ব্যবহার ভবিষ্যদ্বাণীমূলক বিশ্লেষণ, ব্যবহারকারীর আচরণ বিশ্লেষণ, বা কিছু অন্যান্য উন্নত উপাত্ত বিশ্লেষণ পদ্ধতির ব্যবহারকে নির্দেশ করে যা বড় উপাত্ত থেকে মান নিষ্কাশন করে, এবং খুব কমই ডাটা সেটের একটি নির্দিষ্ট আকারের ব্যবহার কে নির্দেশ করে। "কোন সন্দেহ নেই যে এখন যে পরিমাণ তথ্য পাওয়া যাচ্ছে তা সত্যিই বড়, কিন্তু এটা এই নতুন ডাটা বাস্তুতন্ত্রের সবচেয়ে প্রাসঙ্গিক বৈশিষ্ট্য নয়।"[3] ডাটা সেট বিশ্লেষণ "ব্যবসায়িক প্রবণতা চিহ্নিত করা, রোগ প্রতিরোধ, অপরাধ মোকাবেলা ইত্যাদি" এর সাথে নতুন সম্পর্ক খুঁজে পেতে পারে।[4] বিজ্ঞানী, ব্যবসায়িক নির্বাহী, চিকিৎসক, বিজ্ঞাপন এবং সরকার নিয়মিত ইন্টারনেট অনুসন্ধান, ফিনটেক, হেল্থকেয়ার অ্যানালিটিক্স, ভৌগোলিক তথ্য ব্যবস্থা, শহুরে ইনফরমেটিক্স এবং ব্যবসায়িক ইনফরমেটিক্স সহ বৃহৎ ডাটা সেট সঙ্গে সমস্যা পূরণ করে। বিজ্ঞানীরা ই-সায়েন্স কাজের সীমাবদ্ধতার সম্মুখীন হন, যার মধ্যে রয়েছে আবহাওয়া, জিনোমিক্স,[5] কানেক্টোমিক্স, জটিল পদার্থবিজ্ঞান সিমুলেশন, জীববিজ্ঞান, এবং পরিবেশ গত গবেষণা।[6]
মোবাইল ডিভাইস, সস্তা এবং অসংখ্য তথ্য-সংবেদনশীল ইন্টারনেট, এরিয়াল (রিমোট সেন্সিং), সফটওয়্যার লগ, ক্যামেরা, মাইক্রোফোন, রেডিও-ফ্রিকোয়েন্সি আইডেন্টিফিকেশন (আরএফআইডি) রিডার এবং ওয়্যারলেস সেন্সর নেটওয়ার্কের মতো ডিভাইসের মাধ্যমে ডেটা সংগ্রহের আকার ও সংখ্যা দ্রুত বৃদ্ধি পেয়েছে।[7][8] তথ্য সঞ্চয়ের জন্য বিশ্বের প্রযুক্তিগত সক্ষমতা ১৯৮০-এর দশকের পর থেকে প্রতি ৪০ মাসে প্রায় দ্বিগুণ হয়েছে;[9] ২০১২ এর হিসাবে, প্রতিদিন ২.৫ এক্সাবাইট (2.5× বাইট) ডাটা উৎপাদিত হয়।[10]