مقدمه
طی سالهای اخیر ، شناسایی انسان در یک صحنه ویدئویی از یک سیستم نظارت ، به دلیل طیف گسترده ای از برنامه های کاربردی در تشخیص وقایع غیرعادی ، خصوصیات راه رفتن انسان ، شمارش افراد در جمعیت متراکم ، شناسایی افراد ، طبقه بندی جنسیت ، تشخیص زمین خوردن برای افراد مسن و غیره توجه بیشتری را به خود جلب کرده است .
صحنه های بدست آمده از یک فیلم نظارتی معمولاً با وضوح پایین هستند. بیشتر صحنه های گرفته شده توسط یک دوربین ثابت از کمترین تغییر پس زمینه برخوردار هستند. اشیای تحت نظر در فضای باز اغلب در مناطق دور افتاده شناسایی می شوند. بیشتر سیستم های نظارت تصویری دیجیتال موجود برای شناسایی فعالیت های خاص در یک صحنه ویدئویی در زمان واقعی به ناظران انسانی متکی هستند. با این حال ، محدودیت هایی در توانایی انسان برای نظارت بر حوادث همزمان در نمایشگرهای نظارتی وجود دارد .از این رو ، تجزیه و تحلیل حرکت انسان در نظارت تصویری خودکار به یکی از فعال ترین و جذاب ترین مباحث تحقیقاتی در زمینه دید رایانه و تشخیص الگو تبدیل شده است.
یک سیستم هوشمند اطلاعات طبقه بندی شده در حال حرکت را برای طبقه بندی دقیق اشیا شناسایی و ضبط می کند. شی طبقه بندی شده برای تجزیه و تحلیل سطح بالا در حال ردیابی است. در این مطالعه ، ما بر روی شناسایی انسان متمرکز هستیم و شناخت فعالیتهای پیچیده آنها را در نظر نمی گیریم. تشخیص انسان از منظر بینایی ماشین کار دشواری است زیرا به دلیل تغییر ژست ، لباس ، نور و پس زمینه تحت تأثیر طیف گسترده ای از ظواهر ممکن ممکن است قرار گیرد ، اما دانش قبلی در مورد این محدودیت ها می تواند عملکرد تشخیص را بهبود بخشد.
اولین مرحله از فرآیند شناسایی ، تشخیص جسمی است که در حال حرکت است. تشخیص اشیا می تواند با استفاده از یافتن تفاوت پس زمینه ، جریان نوری و تکنیک های فیلتر مکانی – زمانی انجام شود. پس از شناسایی ، می توان با استفاده از ویژگی های مبتنی بر شکل ، مبتنی بر بافت یا حرکت ، یک شی متحرک را به عنوان یک انسان طبقه بندی کرد. یک بررسی با مقایسه تکنیک های موجود برای تشخیص انسان در فیلم های نظارتی در این مقاله ارائه شده است.
فرآیند تشخیص به طور کلی در دو مرحله انجام می شود: تشخیص شی و طبقه بندی اشیا. تشخیص اشیا با تفریق پس زمینه ، جریان نوری و فیلتر مکانی – زمانی انجام می شود. تفریق پس زمینه یک روش محبوب برای تشخیص اشیا است که در آن سعی می شود اشیا متحرک را از تفاوت بین قاب فعلی و یک پس زمینه به صورت پیکسل به پیکسل یا بلوک به بلوک تشخیص دهد. روش های کمی برای انجام تفریق پس زمینه وجود دارد. متداول ترین آنها مدل های مخلوط گاوسی سازگار ، پس زمینه غیر پارامتریک ، اختلاف زمانی ، تاب زمینه و پس زمینه سلسله مراتبی است. روش تشخیص شی مبتنی بر جریان نوری از ویژگی های بردارهای جریان اجسام متحرک در طول زمان برای شناسایی مناطق متحرک در یک توالی تصویر استفاده می کند. جدای از آسیب پذیری آنها در برابر نویز تصویر ، رنگ و نور غیر یکنواخت ، بیشتر روشهای محاسبه جریان الزامات محاسباتی زیادی دارند و به ناپیوستگی های حرکت حساس هستند. برای تشخیص حرکت بر اساس روش های فیلتر مکانی – زمانی ، حرکت از طریق کل حجم داده های مکانی – زمانی سه بعدی (3D) که توسط شخص متحرک در توالی تصویر انجام می شود ، مشخص می شود .از مزایای آنها می توان به پیچیدگی محاسباتی کم و یک فرایند پیاده سازی ساده اشاره کرد. با این حال ، آنها در معرض تغییر در زمان حرکت ها هستند.
روش های طبقه بندی اشیا را می توان به سه دسته تقسیم کرد: شکل ، حرکت و بافت. رویکردهای مبتنی بر شکل ابتدا اطلاعات شکل مناطق متحرک مانند نقاط ، جعبه ها و حباب ها را توصیف می کنند. سپس ، معمولاً به عنوان یک مسئله استاندارد مطابقت الگو در نظر گرفته می شود. با این حال ، بیان بدن انسان و تفاوت در دیدگاه های مشاهده شده منجر به تعداد زیادی از ظواهر ممکن در بدن می شود ، تشخیص دقیق یک انسان در حال حرکت از سایر اجسام متحرک با استفاده از روش مبتنی بر شکل دشوار است. این چالش را می توان با استفاده از تطبیق الگوهای مبتنی بر بخش برطرف کرد . روش های مبتنی بر بافت مانند هیستوگرام گرادیان گرا (HOG) از ویژگی های بعد بالا بر اساس لبه ها استفاده می کنند و از دستگاه بردار پشتیبانی (SVM) برای تشخیص مناطق انسانی استفاده می کنند.
تعداد زیادی از مطالعات شرح داده شده در این بررسی از مجموعه داده های موجود در دسترس عموم استفاده می کند که به طور خاص برای آموزش و ارزیابی ثبت شده است. مجموعه داده حرکتی انسانی KTH شامل شش فعالیت است ، در حالی که مجموعه داده اقدامات انسانی ویزمن و مجموعه داده چند نمای INRIA XMAS به ترتیب شامل 10 و 11 اقدام است. ارزیابی عملکرد مجموعه داده های ردیابی و نظارت (PETS) دارای تعدادی مجموعه داده برای اهداف مختلف تحقیقات مبتنی بر دید است. هر ساله ، PETS یک چارچوب ارزیابی را در مجموعه داده های خاص با هدف خاص اجرا می کند. انستیتوی اتوماسیون ، آکادمی علوم چین (CASIA) پایگاه داده راه رفتن CASIA را برای تشخیص راه رفتن و تحقیقات مرتبط فراهم می کند.