Descrição

O grupo concentra-se prioritariamente em ações visando desenvolver e disponibilizar recursos para a construção de sistemas de reconhecimento automático de voz para o Português Brasileiro. Vários recursos já foram desenvolvidos: dicionários fonéticos, modelos de linguagem, modelos acústicos, novos corpora de voz e texto, entre outros.

Novos recursos e ferramentas estão sendo desenvolvidos, com os seguintes objetivos:

  • Coruja: um sistema de reconhecimento de voz com suporte a edição. Em contraste com sistemas mais simples, baseados em gramáticas, tal sistema permitirá o desenvolvimento de aplicativos como transcrição forense, criação automática de legenda, entre outros.
    Coruja SAPI Compliant, 90%
  • Tornar o sistema Coruja compatível com a interface de programação SAPI (Speech API) da Microsoft. Essa iniciativa visa facilitar a utilização do Coruja em aplicativos destinados a plataforma Windows.
    Coruja SAPI Compliant, 70%
  • Criar um procedimento simples que permita ao usuário fazer o down-sizing do Coruja, criando versões customizadas para os aplicativos a serem desenvolvidos. Esse processo consiste em reduzir o vocabulário e o modelo acústico, baseando-se na gramática fornecida pelo usuário.
    Coruja SAPI Compliant, 80%
  • Implementar um algoritmo para estimar a confiança (confidence) de reconhecimento. Permitir que o sistema rejeite hipóteses com baixa confiança. Isso evita que o sistema reaja a palavras que sequer pertençam ao seu vocabulário.
    Coruja SAPI Compliant, 60%
  • Construir aplicativos como prova-de-conceito tendo em vista pessoas sem formação específica em processamento de voz e que precisem usar a tecnologia. Fomentar a formação de recursos humanos para o desenvolvimento tanto de sistemas de reconhecimento de voz, quanto para aplicativos com interface aural.
    Coruja SAPI Compliant, 90%
  • Desenvolver o SimonBR, um sistema para comando e controle em Português Brasileiro que funcione tanto no Linux quanto no Windows. Esse sistema será baseado no projeto Simon, um open-source speech recognition, e permitirá que usuários possam utilizar a voz navegar em aplicativos de ambos sistemas operacionais.
    Coruja SAPI Compliant, 90%
  • Com base no Coruja, disponibilizar um sistema de criação automática de legendas para programas televisivos.
    Coruja SAPI Compliant, 90%
  • Desenvolver novos algoritmos visando incrementar o desempenho do sistema de reconhecimento de voz. Uma das prioridades consiste no melhoramento do dicionário fonético através do estudo das variações da fala no Brasil e da modelagem acústica através do uso de técnicas para treinamento discriminativo das cadeias escondidas de Markov (HMMs).
    Coruja SAPI Compliant, 90%
  • Aldebaro Klautau Coordenador do laboratório de processamento de sinais (LaPS)

    Professor at ECE Department, UFPA Signal Processing Lab ( LaPS) and Sensors and Embedded Systems Lab ( LASSE)

  • Nelson Neto Professor Adjunto II da Faculdade de Computação da Universidade Federal do Pará.

    Tem experiência nas áreas de processamento digital de sinais, reconhecimento e síntese de fala (voz). É participante do Projeto Fala Brasil, que há sete anos vem provendo recursos gratuitos para a construção de sistemas automáticos de processamento da fala.

  • Aldebaro Klautau Coordenador do laboratório de processamento de sinais (LaPS)

    Professor at ECE Department, UFPA Signal Processing Lab ( LaPS) and Sensors and Embedded Systems Lab ( LASSE)

  • Nelson Neto Professor Adjunto II da Faculdade de Computação da Universidade Federal do Pará.

    Tem experiência nas áreas de processamento digital de sinais, reconhecimento e síntese de fala (voz). É participante do Projeto Fala Brasil, que há sete anos vem provendo recursos gratuitos para a construção de sistemas automáticos de processamento da fala.