Commit ccb7b13d authored by Antoine Caubrière's avatar Antoine Caubrière
Browse files

C6 - TODO + correction biblio

parent c6aabff5
......@@ -492,8 +492,8 @@ Par exemple, une partie importante des concepts impactés négativement peuvent
Il pourrait être intéressant de mettre en place une stratégie d'apprentissage plus souple pour cette entité nommée, qui semble trop spécialisée pour les données d'EN et incapable de se placer efficacement dans le contexte de MEDIA.
Enfin, nous proposons de comparer les deux chaînes d'apprentissage pour l'émission de concepts et de leurs valeurs n'apparaissant pas dans l'ensemble d'apprentissage MEDIA.
% TODO : préciser le 533 : est ce que c'est couple unique ou occurence.
Nous nommons ces concepts les couples UCV (\textit{Unseen Concept-Value pairs}) et nous en dénombrons 533 pour l'ensemble de développement de MEDIA.
Nous nommons ces concepts les couples UCV (\textit{Unseen Concept-Value pairs}).
Nous nombrons 467 UCV unique pour un totale de 533 occurrences sur l'ensemble de développement de MEDIA.
Il s'agit de vérifier si les entités nommées ont un apport concernant la capacité de généralisation du système final.
Nous fournissons dans le tableau~\ref{res:UCV}, le nombre d'UCV correctement reconnus en termes de concepts et de valeurs.
......@@ -678,10 +678,9 @@ Cette comparaison nous montre que nous avons pu effectuer la mise en \oe{}uvre d
Notre approche exploitant les techniques d'apprentissages étudiées au sein de ce chapitre permet de placer un nouvel état de l'art pour la tâche MEDIA.
Dans l'absolue, il semble que cette approche puisse être optimisée davantage, puisque nous n'avons pas réalisé une optimisation fine des hyper paramètres de notre système.
% TODO AC - reformuler ?
Nous n'avons également pas encore exploré la possibilité d'ajouter des informations tierces correspondant par exemple aux caractéristiques exploitées par notre meilleure approche par chaîne de composants.
Nous n'avons également pas encore exploré la possibilité d'utiliser des informations tierces correspondant aux caractéristiques exploitées par la meilleure chaîne de composants.
De plus, nous n'avons pas encore effectué la modification de notre architecture pour des systèmes de types encodeurs-décodeur avec mécanismes d'attention.
De plus, nous n'avons pas effectué la modification de notre architecture pour des systèmes de types encodeurs-décodeur avec mécanismes d'attention.
Bien que ce type d'approches semblent prometteuses pour les tâches de compréhension de la parole, nous orientons la suite de nos travaux dans une autre direction.
Nous considérons que la mise à jour de l'architecture pourrait être faite a posteriori et bénéficier également des derniers travaux que nous proposons au sein de cette thèse.
......@@ -706,7 +705,6 @@ Nous avons par la suite réalisé une optimisation de la profondeur du système,
L'approche finale que nous mettons en \oe{}uvre nous permet d'obtenir des performances légèrement supérieures à celles d'une approche par chaîne de composants à jour.
Il est intéressant de noter que notre approche n'exploite que le signal audio et un modèle de langage pour obtenir ces performances.
La chaine de composants bénéficie d'une extraction automatique de caractéristiques en plus des transcriptions manuellement annotées de la parole.
%Il serait intéressant d'effectuer des expérimentations complémentaires en fournissant ces caractéristiques comme données additionnelles à notre approche.
Plutôt que d'optimiser davantage une approche obtenant des performances à l'état de l'art, nous avons choisi, pour la suite de nos travaux, d'effectuer une analyse des erreurs produites par le système.
L'objectif étant de comprendre les sources principales d'erreurs, permettant à terme de développer des stratégies de correction.
......
......@@ -160,7 +160,7 @@
TITLE = {{Confidence measure for speech-to-concept end-to-end spoken language understanding}},
AUTHOR = {Caubri{\`e}re, Antoine and Est{\`e}ve, Yannick and Laurent, Antoine and Morin, Emmanuel},
BOOKTITLE = {Proceedings of the 21th Annual Conference of the International Speech Association (INTERSPEECH)},
ADDRESS = {Shanga{\"i}, China},
ADDRESS = {Shanghai, China},
YEAR = {2020},
MONTH = Oct,
KEYWORDS = {Confidence Measures ; End-to-End ; Spoken Language Understanding SLU ; Neural networks},
......
......@@ -855,7 +855,7 @@
givenun=0}}%
}
\list{location}{1}{%
{Shanga{ï}, China}%
{Shanghai, China}%
}
\strng{namehash}{24ca35cad2ed831a51b1d6c44bc68108}
\strng{fullhash}{a54568eb41524e2e058dbbee9e07e40b}
......
[0] Config.pm:302> INFO - This is Biber 2.9
[0] Config.pm:305> INFO - Logfile is 'main.blg'
[31] biber:313> INFO - === ven. oct. 23, 2020, 14:08:01
[52] Biber.pm:371> INFO - Reading 'main.bcf'
[131] Biber.pm:857> INFO - Found 185 citekeys in bib section 0
[146] Biber.pm:3981> INFO - Processing section 0
[167] Biber.pm:4154> INFO - Looking for bibtex format file './biblio/biblio.bib' for section 0
[179] bibtex.pm:1468> INFO - LaTeX decoding ...
[340] bibtex.pm:1294> INFO - Found BibTeX data source './biblio/biblio.bib'
[1218] Utils.pm:169> WARN - BibTeX subsystem: /tmp/noAloY58HA/biblio.bib_3472.utf8, line 377, warning: 49 characters of junk seen at toplevel
[1218] Utils.pm:169> WARN - BibTeX subsystem: /tmp/noAloY58HA/biblio.bib_3472.utf8, line 528, warning: 14 characters of junk seen at toplevel
[1218] Biber.pm:4154> INFO - Looking for bibtex format file './biblio/biblio_perso.bib' for section 0
[1220] bibtex.pm:1468> INFO - LaTeX decoding ...
[1249] bibtex.pm:1294> INFO - Found BibTeX data source './biblio/biblio_perso.bib'
[1344] Utils.pm:169> WARN - BibTeX subsystem: /tmp/noAloY58HA/biblio_perso.bib_3472.utf8, line 7, warning: undefined macro "Dec"
[1345] Utils.pm:169> WARN - BibTeX subsystem: /tmp/noAloY58HA/biblio_perso.bib_3472.utf8, line 21, warning: undefined macro "Jul"
[1345] Utils.pm:169> WARN - BibTeX subsystem: /tmp/noAloY58HA/biblio_perso.bib_3472.utf8, line 36, warning: undefined macro "Sep"
[1345] Utils.pm:169> WARN - BibTeX subsystem: /tmp/noAloY58HA/biblio_perso.bib_3472.utf8, line 53, warning: undefined macro "Sep"
[1345] Utils.pm:169> WARN - BibTeX subsystem: /tmp/noAloY58HA/biblio_perso.bib_3472.utf8, line 69, warning: undefined macro "Oct"
[1345] Utils.pm:169> WARN - BibTeX subsystem: /tmp/noAloY58HA/biblio_perso.bib_3472.utf8, line 82, warning: undefined macro "Nov"
[1345] Utils.pm:169> WARN - BibTeX subsystem: /tmp/noAloY58HA/biblio_perso.bib_3472.utf8, line 126, warning: undefined macro "Apr"
[1345] Utils.pm:169> WARN - BibTeX subsystem: /tmp/noAloY58HA/biblio_perso.bib_3472.utf8, line 140, warning: undefined macro "May"
[1345] Utils.pm:169> WARN - BibTeX subsystem: /tmp/noAloY58HA/biblio_perso.bib_3472.utf8, line 152, warning: undefined macro "May"
[1345] Utils.pm:169> WARN - BibTeX subsystem: /tmp/noAloY58HA/biblio_perso.bib_3472.utf8, line 165, warning: undefined macro "Oct"
[1345] Utils.pm:169> WARN - I didn't find a database entry for 'fillmore1976frame' (section 0)
[1345] Utils.pm:169> WARN - I didn't find a database entry for 'xie2015graph' (section 0)
[1712] UCollate.pm:68> INFO - Overriding locale 'fr-FR' defaults 'normalization = NFD' with 'normalization = prenormalized'
[1712] UCollate.pm:68> INFO - Overriding locale 'fr-FR' defaults 'variable = shifted' with 'variable = non-ignorable'
[1712] Biber.pm:3809> INFO - Sorting list 'apa/global//global/global' of type 'entry' with template 'apa' and locale 'fr-FR'
[1712] Biber.pm:3815> INFO - No sort tailoring available for locale 'fr-FR'
[1875] bbl.pm:617> INFO - Writing 'main.bbl' with encoding 'UTF-8'
[2046] bbl.pm:720> INFO - Output to main.bbl
[2046] Biber.pm:110> INFO - WARNINGS: 14
[29] biber:313> INFO - === ven. oct. 23, 2020, 14:22:32
[54] Biber.pm:371> INFO - Reading 'main.bcf'
[123] Biber.pm:857> INFO - Found 185 citekeys in bib section 0
[137] Biber.pm:3981> INFO - Processing section 0
[146] Biber.pm:4154> INFO - Looking for bibtex format file './biblio/biblio.bib' for section 0
[157] bibtex.pm:1468> INFO - LaTeX decoding ...
[343] bibtex.pm:1294> INFO - Found BibTeX data source './biblio/biblio.bib'
[1320] Utils.pm:169> WARN - BibTeX subsystem: /tmp/gSozo7psXm/biblio.bib_4918.utf8, line 377, warning: 49 characters of junk seen at toplevel
[1320] Utils.pm:169> WARN - BibTeX subsystem: /tmp/gSozo7psXm/biblio.bib_4918.utf8, line 528, warning: 14 characters of junk seen at toplevel
[1320] Biber.pm:4154> INFO - Looking for bibtex format file './biblio/biblio_perso.bib' for section 0
[1322] bibtex.pm:1468> INFO - LaTeX decoding ...
[1346] bibtex.pm:1294> INFO - Found BibTeX data source './biblio/biblio_perso.bib'
[1436] Utils.pm:169> WARN - BibTeX subsystem: /tmp/gSozo7psXm/biblio_perso.bib_4918.utf8, line 7, warning: undefined macro "Dec"
[1436] Utils.pm:169> WARN - BibTeX subsystem: /tmp/gSozo7psXm/biblio_perso.bib_4918.utf8, line 21, warning: undefined macro "Jul"
[1436] Utils.pm:169> WARN - BibTeX subsystem: /tmp/gSozo7psXm/biblio_perso.bib_4918.utf8, line 36, warning: undefined macro "Sep"
[1436] Utils.pm:169> WARN - BibTeX subsystem: /tmp/gSozo7psXm/biblio_perso.bib_4918.utf8, line 53, warning: undefined macro "Sep"
[1436] Utils.pm:169> WARN - BibTeX subsystem: /tmp/gSozo7psXm/biblio_perso.bib_4918.utf8, line 69, warning: undefined macro "Oct"
[1436] Utils.pm:169> WARN - BibTeX subsystem: /tmp/gSozo7psXm/biblio_perso.bib_4918.utf8, line 82, warning: undefined macro "Nov"
[1436] Utils.pm:169> WARN - BibTeX subsystem: /tmp/gSozo7psXm/biblio_perso.bib_4918.utf8, line 126, warning: undefined macro "Apr"
[1437] Utils.pm:169> WARN - BibTeX subsystem: /tmp/gSozo7psXm/biblio_perso.bib_4918.utf8, line 140, warning: undefined macro "May"
[1437] Utils.pm:169> WARN - BibTeX subsystem: /tmp/gSozo7psXm/biblio_perso.bib_4918.utf8, line 152, warning: undefined macro "May"
[1437] Utils.pm:169> WARN - BibTeX subsystem: /tmp/gSozo7psXm/biblio_perso.bib_4918.utf8, line 165, warning: undefined macro "Oct"
[1437] Utils.pm:169> WARN - I didn't find a database entry for 'fillmore1976frame' (section 0)
[1437] Utils.pm:169> WARN - I didn't find a database entry for 'xie2015graph' (section 0)
[1771] UCollate.pm:68> INFO - Overriding locale 'fr-FR' defaults 'normalization = NFD' with 'normalization = prenormalized'
[1771] UCollate.pm:68> INFO - Overriding locale 'fr-FR' defaults 'variable = shifted' with 'variable = non-ignorable'
[1771] Biber.pm:3809> INFO - Sorting list 'apa/global//global/global' of type 'entry' with template 'apa' and locale 'fr-FR'
[1771] Biber.pm:3815> INFO - No sort tailoring available for locale 'fr-FR'
[1937] bbl.pm:617> INFO - Writing 'main.bbl' with encoding 'UTF-8'
[2140] bbl.pm:720> INFO - Output to main.bbl
[2140] Biber.pm:110> INFO - WARNINGS: 14
This is pdfTeX, Version 3.14159265-2.6-1.40.18 (TeX Live 2017/Debian) (preloaded format=pdflatex 2018.12.4) 23 OCT 2020 14:08
This is pdfTeX, Version 3.14159265-2.6-1.40.18 (TeX Live 2017/Debian) (preloaded format=pdflatex 2018.12.4) 23 OCT 2020 14:22
entering extended mode
restricted \write18 enabled.
%&-line parsing enabled.
......@@ -4122,7 +4122,7 @@ Package atveryend Info: Empty hook `AtVeryVeryEnd' on input line 122.
Here is how much of TeX's memory you used:
33052 strings out of 494317
597658 string characters out of 6163362
1175004 words of memory out of 5000000
1175002 words of memory out of 5000000
34724 multiletter control sequences out of 15000+600000
208498 words of font info for 148 fonts, out of 8000000 for 9000
350 hyphenation exceptions out of 8191
......@@ -4144,7 +4144,7 @@ e1/public/kpfonts/jkpmsce.pfb></usr/share/texlive/texmf-dist/fonts/type1/public
psyc.pfb></usr/share/texlive/texmf-dist/fonts/type1/urw/helvetic/uhvb8a.pfb></u
sr/share/texlive/texmf-dist/fonts/type1/urw/helvetic/uhvr8a.pfb></usr/share/tex
live/texmf-dist/fonts/type1/urw/helvetic/uhvro8a.pfb>
Output written on main.pdf (196 pages, 4712005 bytes).
Output written on main.pdf (196 pages, 4712050 bytes).
PDF statistics:
3609 PDF objects out of 4296 (max. 8388607)
3067 compressed objects within 31 object streams
......
No preview for this file type
Supports Markdown
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment