هذه المقالة يتيمة. ساعد بإضافة وصلة إليها في مقالة متعلقة بها

بحيرة بيانات

من أرابيكا، الموسوعة الحرة
اذهب إلى التنقل اذهب إلى البحث

بحيرة البيانات[1] هي نظام أو مستودع للبيانات المخزنة بتنسيقها الطبيعي/الخام[2] تكون عادة كائنات كبيرة الحجم أو ملفات. يغلب أن تكون بحيرة البيانات مخزنًا واحدًا للبيانات تتضمن النسخ الأولية من بيانات النظام المصدر وبيانات الاستشعار والبيانات الاجتماعية وما إلى ذلك[3] والبيانات المحولة المستخدمة لمهام مثل إعداد التقارير والتصور والتحليلات المتقدمة وتعلم الآلة. يمكن أن تتضمن بحيرة البيانات بيانات منظمة من قواعد البيانات العلائقية (الصفوف والأعمدة)، والبيانات شبه المنظمة (القيم المفصولة بفواصل والسجلات و لغة التوصيف القابلة للتوسعة وجسون) والبيانات غير المهيكلة (مثل رسائل البريد الإلكتروني والمستندات وملفات صيغة المستندات المنقولة) والبيانات الثنائية (الصور والصوت والفِديو). [4] يمكن إنشاء بحيرة بيانات «محليًا» (داخل مراكز بيانات المؤسسة) أو «في السحابة« (باستخدام الخدمات السحابية من الموردين مثل Amazon أو Microsoft أو Oracle Cloud أو Google ).

المراجع

  1. ^ Q111421033، ص. 58، QID:Q111421033
  2. ^ "The growing importance of big data quality". The Data Roundtable. 21 نوفمبر 2016. مؤرشف من الأصل في 2023-04-22. اطلع عليه بتاريخ 2020-06-01.
  3. ^ "What is a data lake?". aws.amazon.com. مؤرشف من الأصل في 2023-07-31. اطلع عليه بتاريخ 2020-10-12.
  4. ^ Campbell، Chris. "Top Five Differences between DataWarehouses and Data Lakes". Blue-Granite.com. مؤرشف من الأصل في 2023-03-30. اطلع عليه بتاريخ 2017-05-19.