تولیدکنندگان دوربین در صنایع مختلف علاقمند به رقابت و بازاریابی محصولات خود بر اساس رزولوشن و کیفیت تصویر هستند. این رقابت را می توانیم در تلفن همراه ، دوربین پلاک خوان و حتی در صنعت دوربین نظارت تصویری ببینیم. زمانی، رزولوشن HD یک استاندارد طلائی و چشمگیر بود ، اما اکنون رزولوشن های 4K و 8K استانداردهای مطرح هستند.
حال این سؤال مطرح می شود که آیا واقعاً به چنین رزولوشن بالایی نیاز دارید؟ پاسخ واضح این است که «بستگی دارد» . دوربین های با رزولوشن بالا می توانند جزئیات بیشتری را ثبت کنند و این امری ضروری در برخی از موارد کاربری به شمار می رود. یکی از کاربری هایی که هنوز هم مشکلی با تصویربرداری با رزولوشن پایین ندارد، ویدئوآنالیتیک است.
هر جایی به ویدئو با کیفیت بالا نیاز ندارد
به گفته لی شلفورد (Lee Shelford) ، مدیر مهندسی فروش در کمپانی Genetec ، موارد کاربری نظیر شمارش افراد ، تشخیص اشیا ، نفوذ و عبور از خط به حداقل رزولوشن نیاز دارند. همچنین در موارد کاربری که یادگیری عمیق به کار می رود ، سیستم ویدئوآنالیتیک رزولوشن ویدئو را قبل از پردازش کاهش می دهد.
شلفورد خاطر نشان کرد: «یادگیری عمیق به ما کمک می کند تا به دلیل داده ها و دقتی که به کامپیوتر می دهد، نتایج آنالیتیک بهتری را به دست آوریم. اما یادگیری عمیق، با رزولوشن ثابتی کار می کند که شبکه نورونی با آن تنظیم می شود. این رزولوشن اغلب 512 در 512 پیکسل است ، اگرچه در برخی موارد ممکن است رزولوشن کمتر یا بیشتری را در آن شاهد باشیم. بنابراین ، حتی اگر ویدئوهایی با رزولوشن بالاتر از 720 پیکسل بگیریم نیز اولین کاری که سیستم می کند، رمزگذاری کاهش ویدئو به 512×512 خواهد بود تا الزامات شبکه نورونی را برآورده سازد».
آبیشک میشرا (Abhishek Mishra) دانشمند داده ها در کمپانی هوش مصنوعی Dragonfruit AI پیش زمینه بیشتری از عوامل فنی این مقوله ارائه می کند. رزولوشن لازم، به مدلی بستگی دارد که شما استفاده می کنید. یک مدل تشخیص شیء رایج ، YOLO v4 است که می تواند گزینه آموزش و رابط کاربری را در سه رزولوشن مختلف ارائه کند. اما یک رزولوشن استاندارد انتخابی، 416×416 است.
میشرا اظهار داشت: «حتی اگر ویدئوهای با رزولوشن بالاتر را به مقیاس کوچکتر 416×416 کاهش دهید، الگوریتم می تواند آن را به خوبی پردازش کند، مگر اینکه کار شما بسیار خاص باشد. برای موارد کاربری نظیر تشخیص پلاک خودرو ممکن است به رزولوشن بالاتر نیاز داشته باشید، اما اگر هدف شما تنها تشخیص شیء یا شمارش افراد باشد، این رزولوشن استاندارد، کافی خواهد بود».
رزولوشن بالا برای مشتری به چه معنا است
پردازش ویدئوهای با رزولوشن بالاتر مستلزم قدرت پردازش بالاتر است که در نهایت هزینه ها را افزایش می دهد. هزینه دوربین های با کیفیت نیز بالا است و هزینه کلی پروژه را افزایش خواهد داد. اگر هدف مشتری ویدئوآنالیتیک ابتدایی باشد، می تواند یک دوربین با رزولوشن پایین تهیه کند. اما اگر مشتری بخواهد ویدئوی پخش زنده به منظور نظارت بر نیروی انسانی خود داشته باشد، در این صورت به رزولوشن بالا نیاز خواهد داشت.
شلفورد افزود: «فراموش نکنیم که مدرن ترین فناوری دوربین، قابلیت ارسال چندین نوع ویدئو با رزولوشن های مختلف را به شما می دهد. می توانیم ویدئوی با رزولوشن بالا را برای اپراتورها ارسال کنیم تا بتوانند ویدئوی زنده را با کیفیت های HD یا 4K مشاهده کنند. می توانیم ویدئو را با رزولوشن متوسط و نرخ فریم کمی پایین تر ضبط کنیم تا در فضای ذخیره سازی صرفه جویی کنیم و سپس ویدئوی سوم برای ویدئوآنالیتیک با رزولوشن مورد نیاز ارائه خواهد شد که احتمالاً با کیفیت VGA یا 512×512 خواهد بود؛ همانطور که شبکه نورونی تنظیم شده است».
این قابلیت برای مشتریانی که سیستم های قدیمی تری دارند بسیار مهم است. آنان دیگر برای استفاده از ویدئوآنالیتیک ، نیازی به ارتقای سیستم خود نخواهند داشت.
آمل کولکارنی (Amol Kulkarni) ، نایب رئیس و رئیس منطقه ای کمپانی Dragonfruit AI اظهار داشت: «تا زمانی که مشکلی برای دوربین ها اتفاق نیفتد ، به مشتریان توصیه نمی کنیم که سخت افزارشان را ارتقا دهند. آنان می توانند پلتفرم های آنالیتیک هوشمندی را به کار ببرند که با تمامی انواع دوربین کار کنند ، حتی دوربین آنالوگ و نتایج قابل قبولی را بدون پرداخت هزینه های بالا ارائه خواهند داد».
نتیجه گیری
تولیدکنندگان دوربین به افزایش کیفیت ویدئو و رزولوشن ادامه خواهند داد. درخواست بالای کاربران به داشتن تعداد پیکسل بالاتر و جزئیاتی که ارائه می کنند غیر قابل انکار است. اما همه مشتریان و همه شرایط به این رزولوشن بالا نیاز ندارند. بیشتر انواع ویدئوآنالیتیک تنها به رزولوشن پایین نیاز دارند. در نظر گرفتن این حقیقت حین اجرای ویدئوآنالیتیک می تواند به مشتریان در کاهش هزینه هایشان کمک کند.