اكتشاف النشاط الصوتي

خاصية اكتشاف النشاط الصوتى (بالإنجليزية: Voice activity detection)‏، اختصارًا (VAD)، أو ما يعرف بـ «اكتشاف الحديث» هو تقنية مستخدمة في معالجة الحديث (معالجة الكلام) حيث يتم اكتشاف وجود أو غياب الصوت البشرى.[1] الاستخدام الأساسي لـ (VAD) هو في ترميز الحديث (speech coding) والتعرف على الكلام.

تساعد هذه التقنية على إيقاف بعض العمليات أثناء فترات الصمت في المكالمات الهاتفية عبر تطبيقات «الصوت عبر بروتكول الإنترنت» (الصوت عبر الإنترنت) مما يوفر في عرض النطاق الترددي (bandwidth) للشبكة ويمنع إرسال الحزم (packets) الفارغة.

هناك خوارزميات متعددة تم تطويرها لتوفير مميزات تأخذ في الاعتبار الدقة والحساسية وتأخر البيانات المتغير (latency) ولا يعتمد (VAD) على لغة الحديث بأي شكل من الأشكال.[2]

المراجع

  1. ^ Manoj Bhatia؛ Jonathan Davidson؛ Satish Kalidindi؛ Sudipto Mukherjee؛ James Peters (20 أكتوبر 2006). "VoIP: An In-Depth Analysis - Voice Activity Detection". Cisco. مؤرشف من الأصل في 2020-07-20.
  2. ^ Ravi Ramachandran؛ Richard Mammone (6 ديسمبر 2012). Modern Methods of Speech Processing. Springer Science & Business Media. ص. 102–. ISBN:978-1-4615-2281-2. مؤرشف من الأصل في 2016-11-06.

مصادر