Explicação sobre os cascade classifier….
A primeira parte do código é responsável por determinar qual o padrão que deverá ser utilizado na detecção. Foi utilizado o arquivo padrão (haarcascade_frontalface_default.xml) disponível em https://github.com/Itseez/opencv/tree/master/data/haarcascades. O método cv2.CascadeClassifier() é responsável por abrir o classificador.
Em seguida é criada uma instância da webcam e já dentro do laço de repetição é capturada uma imagem da webcam. Na linha 10 é feito um espelhamento da imagem pois ela pode estar vindo invertida (você vira a cabeça para a esquerda mas na imagem capturada a cabeça vira para a direita), sendo uma instrução opcional.
A detecção realmente acontece no uso da função detectMultiScale(). Os parâmetros necessários para esse método são:
- Esse método espera como parâmetro a imagem onde deve ser procurado a ocorrência do padrão vinculado.
- O segundo parâmetro define quantos vizinhos cada candidato a retângulo deve ter para ser considerado. Em síntese, quanto maior o valor mais seguro será a identificação da face, evitando marcar coisas que não são faces e que acabam sendo marcadas, também pode fazer uma face verdadeira não ser reconhecida por problemas de iluminação e oclusão parcial.
- O terceiro e quarto parâmetros especificam mínimo e máximo que um rosto pode ter na captura. Quanto maior for o valor do tamanho mínimo e menor for a relação com o valor máximo, mais rapidamente o algoritmo finalizará o processo, mas em compensação isso definirá o quão próximo ou distante uma pessoa poderá estar da webcam.
A função detectMultiScale() retornará uma lista de retângulos onde foram identificadas faces e nas linhas 21 e 22 é percorrido essa lista e utilizado os parâmetros da detecção para desenhar retângulos que estarão posicionados onde foram identificadas as faces. Como parâmetros para a função cv2.rectangle() é informada a imagem que vai receber o retângulo, o ponto inicial onde o retângulo será desenhado, o ponto final, a cor (com valores para RGB) e a espessura da linha que será desenhada.
import cv2
arqCasc = 'haarcascade_frontalface_default.xml'
faceCascade = cv2.CascadeClassifier(arqCasc)
webcam = cv2.VideoCapture(0) #instancia o uso da webcam
while True:
s, imagem = webcam.read() #pega efeticamente a imagem da webcam
imagem = cv2.flip(imagem,180) #espelha a imagem
faces = faceCascade.detectMultiScale(
imagem,
minNeighbors=5,
minSize=(30, 30),
maxSize=(200,200)
)
# Desenha um retângulo nas faces detectadas
for (x, y, w, h) in faces:
cv2.rectangle(imagem, (x, y), (x+w, y+h), (0, 255, 0), 2)
cv2.imshow('Video', imagem) #mostra a imagem captura na janela
#o trecho seguinte é apenas para parar o código e fechar a janela
if cv2.waitKey(1) & 0xFF == ord('q'):
break
webcam.release() #dispensa o uso da webcam
cv2.destroyAllWindows() #fecha todas a janelas abertas
O final restante do código é responsável por mostrar a captura em uma janela e finalizar o laço de repetição quando for pressionada a letra ‘q’. Ao encerrar o laço de repetição é liberado o uso da webcam e também fechada todas as janelas que foram abertas (no caso do algoritmo, a única janela aberta).
MOSTRAR VÍDEO COM OS RESULTADOS
LINKAR ARTIGO SOBRE DETEÇÃO DE QUALQUER OBJETO
Referências
https://realpython.com/blog/python/face-recognition-with-python/