Commit 3ac48910 authored by Antoine Caubrière's avatar Antoine Caubrière
Browse files

C5 - mise en forme

parent b7c134e7
......@@ -41,7 +41,9 @@ Après une présentation de notre contexte d'étude dans la première section, n
Nous détaillerons ensuite, en troisième section, la mise en \oe{}uvre de notre système de REN de bout en bout pour la tâche simplifiée que nous définissons.
Enfin, dans une dernière section, nous exploiterons notre approche de bout en bout dans le cadre de la campagne ETAPE.
\vspace{-0.15cm}
\section{Contexte des travaux : ETAPE}
\vspace{-0.1cm}
Nous exploitons la campagne d'évaluation ETAPE~[\cite{gravier2012etape}] comme point de départ pour nos travaux.
Il s'agit de la dernière campagne française recensée pour la reconnaissance des entités nommées dans la parole.
......@@ -60,7 +62,9 @@ Chacun des systèmes doit être optimisé en fonction de la tâche qui lui est p
Pour le système de reconnaissance de la parole, il s'agit de la métrique du taux d'erreur sur les mots (\textit{Word Error Rate, WER}).
Tandis que pour le système de reconnaissance des entités nommées, il s'agit de la métrique du taux d'erreur sur les champs (\textit{Slot Error Rate, SER})~[\cite{makhoul1999performance}].
\vspace{-0.1cm}
\subsection{Résultats de la campagne}
\vspace{-0.05cm}
Nous présentons, ici, uniquement les systèmes ayant conduit aux meilleurs résultats pour la tâche de REN dans la parole.
Il s'agit des couples composés des meilleurs systèmes de RAP et de REN.
......@@ -186,7 +190,7 @@ Il existe donc un lien entre composants et entités nommées.
Nous proposons de le modéliser en réutilisant les prédictions d'un système comme entrée additionnelle des systèmes des niveaux suivants.
Les sorties du premier système seront des entrées additionnelles des systèmes des niveaux 2 et 3 et les sorties du deuxième système seront des entrées supplémentaires du troisième.
La figure~\ref{fig:impl_3-pass} représente schématiquement l'implémentation des systèmes de REN proposée.
Nous donnons dans la figure~\ref{fig:impl_3-pass} une représentation schématique de l'implémentation des systèmes de REN proposée.
\begin{figure}[htbp]
\begin{center}
......@@ -426,7 +430,7 @@ Nous proposons une représentation de ce système dans la figure~\ref{fig:ds2}.
\label{fig:ds2}
\end{figure}
L'aspect, que nous souhaitons exploiter, de ce système est sa fonction de coût.
L'aspect que nous souhaitons exploiter de ce système est sa fonction de coût.
Il s'agit de la fonction de classification temporelle connectionniste~(\textit{Connectionist Temporal Classification, CTC})~[\cite{graves2006connectionist}].
L'intérêt de cette fonction réside dans sa capacité à permettre l'apprentissage de l'alignement entre un spectrogramme de parole et une transcription manuelle associée.
......@@ -441,9 +445,9 @@ Nous y ajoutons l'information des entités nommées, permettant ainsi à un syst
Nous proposons de représenter les EN par leurs frontières de début et de fin encadrant les mots les composants.
Toutefois, la fonction de coût CTC fonctionne à l'échelle des caractères.
Ainsi, nous proposons de ne pas utiliser un label complet comme "\textit{<func>}", mais plutôt d'exploiter des caractères uniques entièrement dédiés à la représentation des EN.
Nous proposons de ne pas utiliser un label complet comme "\textit{<func>}", mais plutôt d'exploiter des caractères uniques entièrement dédiés à la représentation des EN.
Celà correspond à un caractère unique pour chacun des labels d'entrées et nous réduisons chacun des labels de sorties à un unique caractère de fin.
En soit, nous ajoutons des caractères prédictibles dédiés aux frontières des EN, dont l'alignement doit être appris par le système et la fonction CTC.
Nous ajoutons des caractères prédictibles dédiés aux frontières des EN, dont l'alignement doit être appris par le système et la fonction CTC.
En complément, la fonction CTC donne la même importance à chaque caractère émis.
Nous proposons ainsi une modification des transcriptions pour contraindre cette fonction à concentrer l'apprentissage sur les frontières d'EN et leurs valeurs.
......@@ -454,7 +458,6 @@ De cette manière, les types entités nommés et leurs valeurs représentent dé
Nous donnons ci-dessous, un exemple avec chacune des annotations mentionnées dans cette sous-section.
\begin{figure}[htbp]
\begin{center}
\includegraphics[width=0.8\linewidth]{Chapitre5/figures/seq_annot.pdf}
......
......@@ -1083,6 +1083,8 @@
\abx@aux@segm{0}{0}{gravier2012etape}
\abx@aux@segm{0}{0}{nouvel2015entites}
\abx@aux@segm{0}{0}{makhoul1999performance}
\abx@aux@cite{bougares2013lium}
\abx@aux@segm{0}{0}{bougares2013lium}
\@writefile{toc}{\defcounter {refsection}{0}\relax }\@writefile{toc}{\contentsline {section}{\numberline {5.1}Contexte des travaux : ETAPE}{102}{section.5.1}}
\abx@aux@backref{233}{gravier2012etape}{0}{102}{102}
\abx@aux@page{233}{102}
......@@ -1091,8 +1093,6 @@
\abx@aux@backref{235}{makhoul1999performance}{0}{102}{102}
\abx@aux@page{235}{102}
\@writefile{toc}{\defcounter {refsection}{0}\relax }\@writefile{toc}{\contentsline {subsection}{\numberline {5.1.1}R\IeC {\'e}sultats de la campagne}{102}{subsection.5.1.1}}
\abx@aux@cite{bougares2013lium}
\abx@aux@segm{0}{0}{bougares2013lium}
\abx@aux@cite{mccallum2003early}
\abx@aux@segm{0}{0}{mccallum2003early}
\abx@aux@cite{sarawagi2005semi}
......@@ -1110,6 +1110,7 @@
\abx@aux@segm{0}{0}{lample2016neural}
\abx@aux@cite{chiu2016named}
\abx@aux@segm{0}{0}{chiu2016named}
\abx@aux@segm{0}{0}{ma2016end}
\abx@aux@backref{236}{bougares2013lium}{0}{103}{103}
\abx@aux@page{236}{103}
\abx@aux@backref{237}{mccallum2003early}{0}{103}{103}
......@@ -1135,7 +1136,6 @@
\abx@aux@backref{246}{chiu2016named}{0}{103}{103}
\abx@aux@page{246}{103}
\@writefile{toc}{\defcounter {refsection}{0}\relax }\@writefile{toc}{\contentsline {subsection}{\numberline {5.2.1}D\IeC {\'e}ploiement d'un syst\IeC {\`e}me de RAP int\IeC {\'e}grant un mod\IeC {\`e}le neuronal}{103}{subsection.5.2.1}}
\abx@aux@segm{0}{0}{ma2016end}
\abx@aux@cite{sang1999representing}
\abx@aux@segm{0}{0}{sang1999representing}
\@writefile{toc}{\defcounter {refsection}{0}\relax }\@writefile{toc}{\contentsline {subsection}{\numberline {5.2.2}D\IeC {\'e}ploiement d'un syst\IeC {\`e}me de REN int\IeC {\'e}grant un mod\IeC {\`e}le neuronal}{104}{subsection.5.2.2}}
......
[0] Config.pm:302> INFO - This is Biber 2.9
[0] Config.pm:305> INFO - Logfile is 'main.blg'
[41] biber:313> INFO - === mar. nov. 17, 2020, 16:55:42
[84] Biber.pm:371> INFO - Reading 'main.bcf'
[166] Biber.pm:857> INFO - Found 187 citekeys in bib section 0
[180] Biber.pm:3981> INFO - Processing section 0
[191] Biber.pm:4154> INFO - Looking for bibtex format file './biblio/biblio.bib' for section 0
[198] bibtex.pm:1468> INFO - LaTeX decoding ...
[506] bibtex.pm:1294> INFO - Found BibTeX data source './biblio/biblio.bib'
[1857] Utils.pm:169> WARN - BibTeX subsystem: /tmp/SjKAJpkVat/biblio.bib_25363.utf8, line 386, warning: 49 characters of junk seen at toplevel
[1857] Utils.pm:169> WARN - BibTeX subsystem: /tmp/SjKAJpkVat/biblio.bib_25363.utf8, line 537, warning: 14 characters of junk seen at toplevel
[1857] Biber.pm:4154> INFO - Looking for bibtex format file './biblio/biblio_perso.bib' for section 0
[1858] bibtex.pm:1468> INFO - LaTeX decoding ...
[1878] bibtex.pm:1294> INFO - Found BibTeX data source './biblio/biblio_perso.bib'
[2009] Utils.pm:169> WARN - BibTeX subsystem: /tmp/SjKAJpkVat/biblio_perso.bib_25363.utf8, line 7, warning: undefined macro "Dec"
[2009] Utils.pm:169> WARN - BibTeX subsystem: /tmp/SjKAJpkVat/biblio_perso.bib_25363.utf8, line 21, warning: undefined macro "Jul"
[2009] Utils.pm:169> WARN - BibTeX subsystem: /tmp/SjKAJpkVat/biblio_perso.bib_25363.utf8, line 36, warning: undefined macro "Sep"
[2009] Utils.pm:169> WARN - BibTeX subsystem: /tmp/SjKAJpkVat/biblio_perso.bib_25363.utf8, line 53, warning: undefined macro "Sep"
[2009] Utils.pm:169> WARN - BibTeX subsystem: /tmp/SjKAJpkVat/biblio_perso.bib_25363.utf8, line 69, warning: undefined macro "Oct"
[2009] Utils.pm:169> WARN - BibTeX subsystem: /tmp/SjKAJpkVat/biblio_perso.bib_25363.utf8, line 82, warning: undefined macro "Nov"
[2009] Utils.pm:169> WARN - BibTeX subsystem: /tmp/SjKAJpkVat/biblio_perso.bib_25363.utf8, line 126, warning: undefined macro "Apr"
[2009] Utils.pm:169> WARN - BibTeX subsystem: /tmp/SjKAJpkVat/biblio_perso.bib_25363.utf8, line 140, warning: undefined macro "May"
[2009] Utils.pm:169> WARN - BibTeX subsystem: /tmp/SjKAJpkVat/biblio_perso.bib_25363.utf8, line 152, warning: undefined macro "May"
[2009] Utils.pm:169> WARN - BibTeX subsystem: /tmp/SjKAJpkVat/biblio_perso.bib_25363.utf8, line 165, warning: undefined macro "Oct"
[2009] Utils.pm:169> WARN - I didn't find a database entry for 'fillmore1976frame' (section 0)
[2010] Utils.pm:169> WARN - I didn't find a database entry for 'xie2015graph' (section 0)
[2482] UCollate.pm:68> INFO - Overriding locale 'fr-FR' defaults 'variable = shifted' with 'variable = non-ignorable'
[2482] UCollate.pm:68> INFO - Overriding locale 'fr-FR' defaults 'normalization = NFD' with 'normalization = prenormalized'
[2482] Biber.pm:3809> INFO - Sorting list 'apa/global//global/global' of type 'entry' with template 'apa' and locale 'fr-FR'
[2482] Biber.pm:3815> INFO - No sort tailoring available for locale 'fr-FR'
[2762] bbl.pm:617> INFO - Writing 'main.bbl' with encoding 'UTF-8'
[2996] bbl.pm:720> INFO - Output to main.bbl
[2997] Biber.pm:110> INFO - WARNINGS: 14
[31] biber:313> INFO - === mar. nov. 17, 2020, 17:20:07
[53] Biber.pm:371> INFO - Reading 'main.bcf'
[134] Biber.pm:857> INFO - Found 187 citekeys in bib section 0
[155] Biber.pm:3981> INFO - Processing section 0
[164] Biber.pm:4154> INFO - Looking for bibtex format file './biblio/biblio.bib' for section 0
[172] bibtex.pm:1468> INFO - LaTeX decoding ...
[394] bibtex.pm:1294> INFO - Found BibTeX data source './biblio/biblio.bib'
[1452] Utils.pm:169> WARN - BibTeX subsystem: /tmp/htpL81tIfy/biblio.bib_29192.utf8, line 386, warning: 49 characters of junk seen at toplevel
[1452] Utils.pm:169> WARN - BibTeX subsystem: /tmp/htpL81tIfy/biblio.bib_29192.utf8, line 537, warning: 14 characters of junk seen at toplevel
[1452] Biber.pm:4154> INFO - Looking for bibtex format file './biblio/biblio_perso.bib' for section 0
[1454] bibtex.pm:1468> INFO - LaTeX decoding ...
[1477] bibtex.pm:1294> INFO - Found BibTeX data source './biblio/biblio_perso.bib'
[1599] Utils.pm:169> WARN - BibTeX subsystem: /tmp/htpL81tIfy/biblio_perso.bib_29192.utf8, line 7, warning: undefined macro "Dec"
[1601] Utils.pm:169> WARN - BibTeX subsystem: /tmp/htpL81tIfy/biblio_perso.bib_29192.utf8, line 21, warning: undefined macro "Jul"
[1601] Utils.pm:169> WARN - BibTeX subsystem: /tmp/htpL81tIfy/biblio_perso.bib_29192.utf8, line 36, warning: undefined macro "Sep"
[1601] Utils.pm:169> WARN - BibTeX subsystem: /tmp/htpL81tIfy/biblio_perso.bib_29192.utf8, line 53, warning: undefined macro "Sep"
[1601] Utils.pm:169> WARN - BibTeX subsystem: /tmp/htpL81tIfy/biblio_perso.bib_29192.utf8, line 69, warning: undefined macro "Oct"
[1601] Utils.pm:169> WARN - BibTeX subsystem: /tmp/htpL81tIfy/biblio_perso.bib_29192.utf8, line 82, warning: undefined macro "Nov"
[1601] Utils.pm:169> WARN - BibTeX subsystem: /tmp/htpL81tIfy/biblio_perso.bib_29192.utf8, line 126, warning: undefined macro "Apr"
[1602] Utils.pm:169> WARN - BibTeX subsystem: /tmp/htpL81tIfy/biblio_perso.bib_29192.utf8, line 140, warning: undefined macro "May"
[1602] Utils.pm:169> WARN - BibTeX subsystem: /tmp/htpL81tIfy/biblio_perso.bib_29192.utf8, line 152, warning: undefined macro "May"
[1602] Utils.pm:169> WARN - BibTeX subsystem: /tmp/htpL81tIfy/biblio_perso.bib_29192.utf8, line 165, warning: undefined macro "Oct"
[1602] Utils.pm:169> WARN - I didn't find a database entry for 'fillmore1976frame' (section 0)
[1602] Utils.pm:169> WARN - I didn't find a database entry for 'xie2015graph' (section 0)
[2003] UCollate.pm:68> INFO - Overriding locale 'fr-FR' defaults 'variable = shifted' with 'variable = non-ignorable'
[2003] UCollate.pm:68> INFO - Overriding locale 'fr-FR' defaults 'normalization = NFD' with 'normalization = prenormalized'
[2003] Biber.pm:3809> INFO - Sorting list 'apa/global//global/global' of type 'entry' with template 'apa' and locale 'fr-FR'
[2003] Biber.pm:3815> INFO - No sort tailoring available for locale 'fr-FR'
[2202] bbl.pm:617> INFO - Writing 'main.bbl' with encoding 'UTF-8'
[2395] bbl.pm:720> INFO - Output to main.bbl
[2395] Biber.pm:110> INFO - WARNINGS: 14
This is pdfTeX, Version 3.14159265-2.6-1.40.18 (TeX Live 2017/Debian) (preloaded format=pdflatex 2018.12.4) 17 NOV 2020 16:55
This is pdfTeX, Version 3.14159265-2.6-1.40.18 (TeX Live 2017/Debian) (preloaded format=pdflatex 2018.12.4) 17 NOV 2020 17:20
entering extended mode
restricted \write18 enabled.
%&-line parsing enabled.
......@@ -3585,18 +3585,22 @@ Overfull \hbox (0.84996pt too wide) detected at line 26
) [100
] [101] [102] [103] [104] [105]
<Chapitre5/figures/seq_arb_bio.pdf, id=2513, 522.03032pt x 195.6108pt>
] [101] [102] [103] [104]
<Chapitre5/figures/seq_arb_bio.pdf, id=2507, 522.03032pt x 195.6108pt>
File: Chapitre5/figures/seq_arb_bio.pdf Graphic file (type pdf)
<use Chapitre5/figures/seq_arb_bio.pdf>
Package pdftex.def Info: Chapitre5/figures/seq_arb_bio.pdf used on input line
171.
175.
(pdftex.def) Requested size: 455.24411pt x 170.5919pt.
<Chapitre5/figures/3-pass.pdf, id=2515, 562.01968pt x 221.8689pt>
[105]
<Chapitre5/figures/3-pass.pdf, id=2516, 562.01968pt x 221.8689pt>
File: Chapitre5/figures/3-pass.pdf Graphic file (type pdf)
<use Chapitre5/figures/3-pass.pdf>
Package pdftex.def Info: Chapitre5/figures/3-pass.pdf used on input line 193.
Package pdftex.def Info: Chapitre5/figures/3-pass.pdf used on input line 197.
(pdftex.def) Requested size: 455.24411pt x 179.71959pt.
Underfull \vbox (badness 10000) has occurred while \output is active []
[106 <./Chapitre5/figures/seq_arb_bio.pdf
pdfTeX warning: pdflatex (file ./Chapitre5/figures/seq_arb_bio.pdf): PDF inclus
......@@ -3615,12 +3619,12 @@ Underfull \vbox (badness 10000) has occurred while \output is active []
File: Chapitre5/figures/seq_annot_simple.pdf Graphic file (type pdf)
<use Chapitre5/figures/seq_annot_simple.pdf>
Package pdftex.def Info: Chapitre5/figures/seq_annot_simple.pdf used on input
line 404.
line 408.
(pdftex.def) Requested size: 455.24411pt x 59.9032pt.
<Chapitre5/figures/DS2.png, id=2627, 812.03375pt x 931.48pt>
File: Chapitre5/figures/DS2.png Graphic file (type png)
<use Chapitre5/figures/DS2.png>
Package pdftex.def Info: Chapitre5/figures/DS2.png used on input line 423.
Package pdftex.def Info: Chapitre5/figures/DS2.png used on input line 427.
(pdftex.def) Requested size: 227.62206pt x 261.09688pt.
[112 <./Chapitre5/figures/seq_annot_simple.pdf
......@@ -3633,10 +3637,10 @@ nclusion: invalid other resource which is no dict (key 'ProcSets', type <array>
File: Chapitre5/figures/seq_annot.pdf Graphic file (type pdf)
<use Chapitre5/figures/seq_annot.pdf>
Package pdftex.def Info: Chapitre5/figures/seq_annot.pdf used on input line 46
0.
3.
(pdftex.def) Requested size: 364.19667pt x 138.28462pt.
Overfull \hbox (5.07114pt too wide) in paragraph at lines 468--474
Overfull \hbox (5.07114pt too wide) in paragraph at lines 471--477
\T1/jkp/m/n/10.95 nous réa-li-sons des ex-pé-ri-men-ta-tions pour nous as-su-re
r de la via-bi-lité de notre ap-proche. Comme
[]
......@@ -3647,13 +3651,13 @@ pdfTeX warning: pdflatex (file ./Chapitre5/figures/seq_annot.pdf): PDF inclusio
n: invalid other resource which is no dict (key 'ProcSets', type <array>); igno
red.
>] [115]
Overfull \hbox (1.29897pt too wide) in paragraph at lines 552--555
Overfull \hbox (1.29897pt too wide) in paragraph at lines 555--558
[]\T1/jkp/m/n/10.95 De plus, l'éva-lua-tion sur l'en-semble de dé-ve-lop-pe-men
t dé-fi-nit les per-for-mances at-tei-gnables
[]
[116] [117] [118]
Overfull \hbox (1.03621pt too wide) in paragraph at lines 676--679
Overfull \hbox (1.03621pt too wide) in paragraph at lines 679--682
[]\T1/jkp/m/n/10.95 Ces ré-sul-tats peuvent êtres com-pa-rés à ceux ob-te-nus s
ur l'en-semble de test des tables [][]5.3[][], [][]5.4[][]
[]
......@@ -4155,7 +4159,7 @@ e1/public/kpfonts/jkpmsce.pfb></usr/share/texlive/texmf-dist/fonts/type1/public
psyc.pfb></usr/share/texlive/texmf-dist/fonts/type1/urw/helvetic/uhvb8a.pfb></u
sr/share/texlive/texmf-dist/fonts/type1/urw/helvetic/uhvr8a.pfb></usr/share/tex
live/texmf-dist/fonts/type1/urw/helvetic/uhvro8a.pfb>
Output written on main.pdf (192 pages, 4732175 bytes).
Output written on main.pdf (192 pages, 4732117 bytes).
PDF statistics:
3601 PDF objects out of 4296 (max. 8388607)
3063 compressed objects within 31 object streams
......
No preview for this file type
Supports Markdown
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment