Commit 5f9cfaa3 authored by Antoine Caubrière's avatar Antoine Caubrière
Browse files

C6 - correction Deep speech 2

parent 4111d714
......@@ -51,11 +51,11 @@ Nous effectuons donc la mise en \oe{}uvre de cette approche par chaîne de compo
\subsection{Approche par chaîne de composants}
\label{subsec:soa-slu-cc}
La chaîne de composants que nous mettons en \oe{}uvre correspond à l'imbrication d'un système de reconnaissance de la parole neuronale de type DeepSpeech 2 et d'un système d'extraction des concepts sémantiques exploitant une approche par CRF.
La chaîne de composants que nous mettons en \oe{}uvre correspond à l'imbrication d'un système de reconnaissance de la parole neuronale de type Deep Speech 2 et d'un système d'extraction des concepts sémantiques exploitant une approche par CRF.
L'objectif est de déterminer les performances à l'état de l'art de cette approche pour l'ensemble de données MEDIA.
Nous avons choisi d'utiliser DeepSpeech 2 comme système de RAP puisque celui obtient des résultats similaires à un système de RAP hybride de modèle de markov caché et neuronal.
Nous avons choisi d'utiliser Deep Speech 2 comme système de RAP puisque celui obtient des résultats similaires à un système de RAP hybride de modèle de markov caché et neuronal.
Nous proposons également d'exploiter les données de l'ensemble PORTMEDIA pour augmentater les données avant une optimisation du système de RAP sur MEDIA.
Nous mettons ainsi en place une approche par transfert d'apprentissage en trois étapes successives, dans un but d'optimisation fine (\textit{fine tuning}).
......@@ -655,7 +655,7 @@ Nous proposons dans la sous-section suivante d'effectuer leur comparaison au mei
Notre meilleure approche de bout en bout exploite pleinement toutes les contributions que nous avons apportées dans le cadre de cette thèse.
Notre meilleure approche par chaîne de composants est constituée d'un système de RAP DeepSpeech 2 optimisé pour MEDIA.
Notre meilleure approche par chaîne de composants est constituée d'un système de RAP Deep Speech 2 optimisé pour MEDIA.
L'extraction des concepts sémantique de MEDIA à l'aide des transcriptions et annotations manuelles enrichies par des caractéristiques extraites automatiquement est réalisée avec un CRF.
Pour faciliter la comparaison entre ces deux systèmes, nous reportons dans le table~\ref{res:comp_soa} les résultats déjà vus dans les tables~\ref{res:MEDIA_CC_MaJ} et~\ref{res:prof_mix_stars}.
......
Supports Markdown
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment