@@ -41,7 +41,9 @@ Après une présentation de notre contexte d'étude dans la première section, n
Nous détaillerons ensuite, en troisième section, la mise en \oe{}uvre de notre système de REN de bout en bout pour la tâche simplifiée que nous définissons.
Enfin, dans une dernière section, nous exploiterons notre approche de bout en bout dans le cadre de la campagne ETAPE.
\vspace{-0.15cm}
\section{Contexte des travaux : ETAPE}
\vspace{-0.1cm}
Nous exploitons la campagne d'évaluation ETAPE~[\cite{gravier2012etape}] comme point de départ pour nos travaux.
Il s'agit de la dernière campagne française recensée pour la reconnaissance des entités nommées dans la parole.
...
...
@@ -60,7 +62,9 @@ Chacun des systèmes doit être optimisé en fonction de la tâche qui lui est p
Pour le système de reconnaissance de la parole, il s'agit de la métrique du taux d'erreur sur les mots (\textit{Word Error Rate, WER}).
Tandis que pour le système de reconnaissance des entités nommées, il s'agit de la métrique du taux d'erreur sur les champs (\textit{Slot Error Rate, SER})~[\cite{makhoul1999performance}].
\vspace{-0.1cm}
\subsection{Résultats de la campagne}
\vspace{-0.05cm}
Nous présentons, ici, uniquement les systèmes ayant conduit aux meilleurs résultats pour la tâche de REN dans la parole.
Il s'agit des couples composés des meilleurs systèmes de RAP et de REN.
...
...
@@ -186,7 +190,7 @@ Il existe donc un lien entre composants et entités nommées.
Nous proposons de le modéliser en réutilisant les prédictions d'un système comme entrée additionnelle des systèmes des niveaux suivants.
Les sorties du premier système seront des entrées additionnelles des systèmes des niveaux 2 et 3 et les sorties du deuxième système seront des entrées supplémentaires du troisième.
La figure~\ref{fig:impl_3-pass} représente schématiquement l'implémentation des systèmes de REN proposée.
Nous donnons dans la figure~\ref{fig:impl_3-pass}une représentation schématique de l'implémentation des systèmes de REN proposée.
\begin{figure}[htbp]
\begin{center}
...
...
@@ -426,7 +430,7 @@ Nous proposons une représentation de ce système dans la figure~\ref{fig:ds2}.
\label{fig:ds2}
\end{figure}
L'aspect, que nous souhaitons exploiter, de ce système est sa fonction de coût.
L'aspect que nous souhaitons exploiter de ce système est sa fonction de coût.
Il s'agit de la fonction de classification temporelle connectionniste~(\textit{Connectionist Temporal Classification, CTC})~[\cite{graves2006connectionist}].
L'intérêt de cette fonction réside dans sa capacité à permettre l'apprentissage de l'alignement entre un spectrogramme de parole et une transcription manuelle associée.
...
...
@@ -441,9 +445,9 @@ Nous y ajoutons l'information des entités nommées, permettant ainsi à un syst
Nous proposons de représenter les EN par leurs frontières de début et de fin encadrant les mots les composants.
Toutefois, la fonction de coût CTC fonctionne à l'échelle des caractères.
Ainsi, nous proposons de ne pas utiliser un label complet comme "\textit{<func>}", mais plutôt d'exploiter des caractères uniques entièrement dédiés à la représentation des EN.
Nous proposons de ne pas utiliser un label complet comme "\textit{<func>}", mais plutôt d'exploiter des caractères uniques entièrement dédiés à la représentation des EN.
Celà correspond à un caractère unique pour chacun des labels d'entrées et nous réduisons chacun des labels de sorties à un unique caractère de fin.
En soit, nous ajoutons des caractères prédictibles dédiés aux frontières des EN, dont l'alignement doit être appris par le système et la fonction CTC.
Nous ajoutons des caractères prédictibles dédiés aux frontières des EN, dont l'alignement doit être appris par le système et la fonction CTC.
En complément, la fonction CTC donne la même importance à chaque caractère émis.
Nous proposons ainsi une modification des transcriptions pour contraindre cette fonction à concentrer l'apprentissage sur les frontières d'EN et leurs valeurs.
...
...
@@ -454,7 +458,6 @@ De cette manière, les types entités nommés et leurs valeurs représentent dé
Nous donnons ci-dessous, un exemple avec chacune des annotations mentionnées dans cette sous-section.
\@writefile{toc}{\defcounter{refsection}{0}\relax}\@writefile{toc}{\contentsline{section}{\numberline{5.1}Contexte des travaux : ETAPE}{102}{section.5.1}}
\@writefile{toc}{\defcounter{refsection}{0}\relax}\@writefile{toc}{\contentsline{subsection}{\numberline{5.1.1}R\IeC{\'e}sultats de la campagne}{102}{subsection.5.1.1}}
\@writefile{toc}{\defcounter{refsection}{0}\relax}\@writefile{toc}{\contentsline{subsection}{\numberline{5.2.1}D\IeC{\'e}ploiement d'un syst\IeC{\`e}me de RAP int\IeC{\'e}grant un mod\IeC{\`e}le neuronal}{103}{subsection.5.2.1}}
\abx@aux@segm{0}{0}{ma2016end}
\abx@aux@cite{sang1999representing}
\abx@aux@segm{0}{0}{sang1999representing}
\@writefile{toc}{\defcounter{refsection}{0}\relax}\@writefile{toc}{\contentsline{subsection}{\numberline{5.2.2}D\IeC{\'e}ploiement d'un syst\IeC{\`e}me de REN int\IeC{\'e}grant un mod\IeC{\`e}le neuronal}{104}{subsection.5.2.2}}