O que é Visão Computacional?

No contexto do Vídeo Monitoramento, os metadados são descrições textuais que detalham o conteúdo visual de um vídeo.

Os metadados podem fornecer uma variedade de informações úteis. Eles podem oferecer uma descrição detalhada da situação, identificar objetos importantes que estão visíveis e fornecer informações sobre características específicas associadas à cena.

Os metadados conferem contexto aos eventos, permitindo que grandes quantidades de gravações sejam organizadas e rapidamente acessadas em buscas. Podem incluir detalhes como cores de carros e roupas, localizações exatas de objetos ou a direção de um movimento, por exemplo.

Por isso, entender como manipular metadados tem se tornado cada vez mais importante para garantir segurança, proteção e eficiência nas operações comerciais.

Neste artigo falaremos sobre os metadados no contexto de monitoramento e eficiência operacional, detalhando como os metadados funcionam e como eles são utilizados para implementar inteligência aos sistemas de monitoramento.

Confira!

Tabela de Conteúdos

O que são Metadados de Vídeo?

Os metadados são conjuntos de informações estruturadas que descrevem, localizam ou facilitam a recuperação, uso ou gerenciamento de um recurso de informação.

Eles podem ser classificados em três diferentes tipos – administrativos, estruturais e descritivos:

  • Os metadados administrativos fornecem informações para ajudar a gerenciar um recurso, como quando e como ele foi criado, o tipo de arquivo e quem pode acessá-lo;
  • Os metadados estruturais detalham como os componentes de um recurso estão organizados;
  • Os metadados descritivos fornecem informações que ajudam na descoberta e identificação de outros dados.

Em um Sistema de CFTV, os metadados fornecem uma descrição textual do conteúdo do vídeo, identificando objetos de interesse ou fornecendo uma descrição detalhada da cena.

Como os Metadados de Vídeo são gerados?

Os metadados são gerados em tempo real por meio de Analíticos de Vídeo. Os analíticos são algoritmos que podem ser executados diretamente na câmera ou em um servidor dedicado.

Até pouco tempo atrás, a análise de vídeo era realizada exclusivamente nos servidores, uma vez que demandava um nível de processamento que os dispositivos de borda não conseguiam suportar.

Com o aumento da capacidade de processamento das câmeras nos últimos anos, tornou-se possível realizar análises avançadas diretamente na borda.

As ferramentas de análise na borda têm acesso a vídeos não compactados e latência extremamente baixa. Isso permite uma utilização rápida e em tempo real, evitando os custos e complexidades adicionais associadas à transferência de todo o conteúdo de vídeo para processamento em outras partes do sistema.

Entretanto, é importante salientar que as câmeras equipadas com capacidade de processamento suficiente para realizar análises na borda geralmente têm um custo mais elevado. Isso introduz uma consideração importante ao projetar um Sistema de Vídeo Monitoramento.

O projetista deve considerar investir em câmeras com maior capacidade de processamento ou alocar recursos para um servidor dedicado para processar os analíticos de vídeo.

Essa decisão deve ser baseada em uma análise cuidadosa do retorno sobre o investimento, levando em conta fatores como o desempenho desejado do sistema, o orçamento disponível e as necessidades específicas do projeto.

A escolha ideal pode variar dependendo das circunstâncias específicas de cada projeto.

Onde os Metadados são utilizados?

Os principais “consumidores de metadados” podem ser categorizados da seguinte maneira:

  1. Aplicações de Borda;
  2. Aplicações de Processamento Híbrido;
  3. Sistemas de Gerenciamento de Vídeo (VMS);
  4. Dashboards.

Aplicações de Borda

As Aplicações de Borda se referem ao uso de ferramentas de análise que são executadas diretamente na câmera. Essas ferramentas podem aplicar filtros e regras lógicas para processar as informações relacionadas aos objetos detectados na cena.

Essas ferramentas de análise na borda são capazes de acionar ações específicas com base em eventos pré-definidos ou comportamentos identificados. Por exemplo, elas podem controlar uma câmera PTZ (Pan-Tilt-Zoom) para acompanhar o movimento de uma pessoa detectada na cena.

A evolução da computação em borda permitiu a utilização de ferramentas avançadas como Inteligência Artificial (IA), Machine Learning e Deep Learning dentro das próprias câmeras. Isso representa um marco significativo na forma como processamos e interpretamos dados.

Além disso, as câmeras equipadas com capacidade de processamento na borda podem armazenar vídeos diretamente na câmera através de um cartão SD, aumentando a confiabilidade do sistema e possibilitando aplicações de sistemas de alto desempenho em regiões remotas.

Aplicações de Processamento Híbrido

As Aplicações de Processamento Híbrido representam um modelo onde o processamento na borda (na câmera) e o processamento no servidor são combinados para realizar análises mais avançadas.

Nesse modelo, o pré-processamento é geralmente realizado na própria câmera. Isso pode incluir tarefas como a detecção inicial de objetos, a aplicação de filtros e a execução de análises básicas.

O processamento adicional é então realizado no servidor. Isso pode envolver análises mais complexas que requerem mais poder de processamento ou capacidade de armazenamento do que uma câmera pode fornecer.

Por exemplo, isso pode incluir a correlação de dados de várias câmeras, a realização de análises de longo prazo ou a aplicação de algoritmos de aprendizado de máquina mais avançados.

Sistemas de Gerenciamento de Vídeo (VMS)

Um Sistema de Gerenciamento de Vídeo (VMS) desempenha um papel fundamental no contexto do Vídeo Monitoramento Inteligente. Ele atua como o centro de controle do sistema, permitindo a recepção, processamento e armazenamento das imagens e vídeos provenientes das câmeras IP.

O VMS tem a capacidade de integrar todos os recursos avançados em uma única plataforma. Isso inclui tecnologias como reconhecimento facial, detecção de movimento e análise de comportamento, ampliando as capacidades do sistema de monitoramento.

Um dos principais recursos do VMS é a sua capacidade de pesquisa avançada. Ele possui filtros de pesquisa que permitem aos operadores localizar rapidamente eventos específicos em gravações recorrentes. Os critérios de pesquisa podem ser definidos utilizando metadados, como data, hora, câmera, tipo de evento, cor do objeto e direção do movimento, por exemplo.

Além disso, o VMS possui recursos robustos de gerenciamento de usuários e permissões. Isso permite que os administradores criem perfis de usuários com diferentes níveis de acesso e controle, garantindo que apenas indivíduos autorizados tenham acesso às câmeras e às gravações. Isso reforça a segurança e a privacidade do sistema.

Por fim, um VMS pode se integrar a outros sistemas de segurança, como controle de acesso e sistemas de alarme. Isso permite uma visão unificada dos eventos, melhorando a eficácia e a eficiência do sistema de segurança.

Dashboards

Os Dashboards são plataformas de Inteligência de Negócios (Business Intelligence). Eles recebem e organizam metadados para facilitar a análise de tendências, tanto históricas quanto em tempo real.

Esses dashboards empregam análises estatísticas baseadas em dados coletados, como o fluxo de clientes ou a experiência geral dos clientes em um estabelecimento. Essas análises fornecem insights valiosos que podem orientar a tomada de decisões baseadas em dados, resultando em operações mais eficientes e eficazes.

Os metadados coletados pelos dashboards podem abranger uma ampla gama de informações, desde detalhes sobre o comportamento do cliente até métricas de desempenho do sistema. Esses dados são então processados e apresentados de maneira visualmente intuitiva, permitindo que os usuários identifiquem rapidamente padrões, tendências e anomalias.

Além disso, os dashboards podem ser personalizados para atender às necessidades específicas de cada organização. Eles podem ser configurados para rastrear métricas específicas, fornecer alertas em tempo real e até mesmo integrar dados de várias fontes para uma visão mais completa.

Como os metadados são transmitidos?

Os metadados gerados em Sistemas de CFTV podem ser entregues de duas maneiras distintas, dependendo do contexto e das necessidades do sistema que irá consumir essas informações:

Transmissão em tempo real

Nesse método, uma descrição completa da cena é fornecida, cobrindo todos os quadros, mesmo quando não há atividade ou objetos presentes. 

Os metadados são enviados continuamente e sob demanda. Isso é essencial em situações que exigem uma resposta imediata e uma consciência situacional precisa.

Esta figura ilustra o fluxo de metadados, onde quadros contínuos da câmera fornecem informações em tempo real sobre a cena. Cada quadro captura a cena em um momento específico, independente de eventos passados.

  1. No Quadro 1, os objetos A e B são detectados, classificando A como uma pessoa vestindo roupas vermelhas e B como uma pessoa com roupas azuis.

  2. No Quadro 2, a câmera atualiza a classificação, determinando que o objeto A na verdade veste roupas azuis, e o objeto B veste roupas amarelas. Embora os objetos sejam os mesmos do Quadro 1, seus atributos de cor mudam e isso é refletido nos metadados.

  3. O Quadro 3 mostra a ausência do objeto B, com a câmera rastreando apenas o objeto A, ainda classificado como uma pessoa vestindo roupas azuis.

Entrega otimizada

Nessa abordagem, os metadados relacionados a cada objeto específico na cena são combinados em uma única entidade, um processo que pode ser referido como aglutinação.

Isso significa que, em vez de tratar cada instância de cada objeto como uma entidade separada, todas as instâncias do mesmo objeto são tratadas como uma única entidade. Isso reduz significativamente a quantidade total de dados que precisam ser armazenados e processados, resultando em uma utilização mais eficiente dos recursos do sistema.

Além disso, na entrega otimizada, os metadados são fornecidos apenas quando há objetos presentes na cena. Isso evita a transmissão de dados desnecessários e garante que apenas as informações mais relevantes sejam entregues ao usuário final.

Esta figura demonstra a entrega otimizada de metadados, onde a câmera fornece informações em um formato unificado com base no rastreamento detectado dos objetos na cena. Os quadros para cada objeto abrangem todos os detalhes conhecidos ao longo da vida útil do rastreamento do objeto.

  1. No primeiro quadro, são apresentados detalhes sobre o objeto B, incluindo sua primeira e última detecção, resumo da trajetória e atributos detectados durante o rastreamento. O objeto B tinha 50% de probabilidade de estar vestindo roupas amarelas e 50% de probabilidade de estar vestindo roupas azuis.

  2. O segundo quadro espelha este formato para o objeto A, revelando uma probabilidade de 33% de roupas vermelhas e uma probabilidade de 67% de roupas azuis.

Entender as vantagens e desvantagens de cada abordagem é essencial para projetar a arquitetura do sistema.

Além disso, os metadados podem ser entregues por meio de vários protocolos de comunicação e formatos de arquivo, dependendo das necessidades e preferências específicas do sistema consumidor.

Combinando Metadados de diferentes fontes

A integração de metadados de múltiplas fontes é uma estratégia poderosa que maximiza o potencial dos metadados.

Quando aplicados a diversas fontes de dados – visuais, auditivas, de atividades e de processos – os metadados podem fornecer insights valiosos para o gerenciamento eficaz de qualquer local.

Fontes de dados como rastreamento de RFID, coordenadas de GPS, eventos de alarme, leituras de medidores (como temperatura ou níveis químicos), detecção de ruído e dados transacionais de ponto de venda são exemplos de fontes de metadados que podem ser integradas. A chave para essa integração é o alinhamento dos dados de todas as fontes de acordo com seus registros de data e hora.

A combinação de metadados de diferentes fontes resulta em uma visão mais completa e rica do que a que pode ser obtida de cada fonte isoladamente. Isso permite a obtenção de insights mais qualificados e a tomada de decisões mais eficiente.

Conclusão

Em conclusão, vimos que os metadados desempenham um papel crucial na otimização da Segurança e da Gestão Operacional.

Seja através da entrega em tempo real para respostas imediatas, da entrega otimizada para uma visão geral, ou da combinação de metadados de várias fontes para uma visão mais completa, os metadados estão transformando a maneira como gerenciamos e interpretamos as informações.

À medida que continuamos a explorar e inovar nesta área, podemos esperar ver ainda mais melhorias na eficiência, eficácia e capacidade dos Sistemas de Vídeo Monitoramento.

Compartilhe:
Facebook
LinkedIn
WhatsApp
Comentários
Artigos Relacionados
Sobre o Autor

Acadêmico de Engenharia de Computação na Universidade Estadual de Ponta Grossa, Certificado em Tráfego Pago do Google pela Escola Brasileira de Marketing Digital | Certificado em Cabeamento Estruturado pela CommScope.