Имя: Пароль:
IT
Мобильный мир
Детекция вертикальных движений языка в реальном времени на мобильной камере — выбор подхода
0 Alex-eng
 
12.06.26
10:56
Всем привет.
Работаю над задачей детекции артикуляционных движений языка через фронтальную камеру смартфона. Конкретно нужно стабильно классифицировать вертикальное движение (подъём / опускание / нейтральное положение) в реальном времени. Среда бытовая — обычное освещение, без доп. оборудования. Аудитория - дети, что добавляет вариативности по анатомии и поведению перед камерой.
Пощупал MediaPipe, но с самим языком он так себе работает. Подскажите, есть ли подходы, которые реально работают, или это в принципе задача с жёсткими ограничениями, при таких условиях съёмки. Или может можно подтянуть из смежных областей что-то, условно, из трекинга деформируемых объектов или промышленного детекшена, где похожая задача уже решена достаточно хорошо?
Если кто-то реально делал детекцию или трекинг внутриротовых объектов (язык, зубы) на мобильном железе что реально может сработать с высокой точностью детекшена?
Заранее спасибо.
1 Волшебник
 
12.06.26
11:25
Вам понадобятся нанодатчики, встроенные в мышцы гортани и ротовой полости.
2 p-soft
 
12.06.26
11:27
сейчас практически все мобилки умеют отслеживать направление взгляда. скорее всего библиотеки готовые где то есть.
и думаю что прокатит нейронку по месту обучать на типовой мимике.
3 uno-group
 
12.06.26
15:37
Read Their Lips: Удобный бесплатный веб-сервис для расшифровки речи без звука. Вы загружаете видео, выделяете область лица говорящего, и нейросеть анализирует движения губ. Отлично справляется с английским языком.
Lip Reading AI (Android / iOS): Приложение, позволяющее распознавать беззвучное движение губ в шумной обстановке или при общении с людьми с нарушениями речи.
LipreadPro: Продвинутый онлайн-инструмент, который загружает ваше видео и выдает текстовую расшифровку артикуляции говорящего в виде читаемого текста.
4 uno-group
 
12.06.26
15:42
1. Wi-Fi Sensing: использование существующих сигналовРоутер или mesh-система анализирует состояние канала (Channel State Information — CSI) между передатчиком и приемником. Когда человек идет, садится или дышит, меняются параметры приема.Плюсы: Не требует дополнительных камер или аппаратных датчиков движения.Минусы: Возможны ложные срабатывания от домашних животных или роботов-пылесосов. Где используется: Продвинутые роутеры (например, функция WiFi Motion в оборудовании Xfinity, некоторые роутеры Asus). Эффективно применяется для охраны, мониторинга активности пожилых людей (упал/не двигается) или домашней автоматизации. В теории можно и движения языка отслеживать объект достаточно специфической формы. Если сможешь обучишь этому нейронку спецлужбы к себе точно загребут.
5 uno-group
 
12.06.26
15:48