Navigasjon

  • Hopp til innhold
NTNU Hjemmeside NTNU Hjemmeside

ntnu.no

  • Studier
    • Studere på NTNU
    • Finn studieprogram
    • Søke opptak
    • Videreutdanning og deltid
    • Forkurs og oppfriskning
  • Studentliv
    • Student i Gjøvik
    • Student i Trondheim
    • Student i Ålesund
  • Forskning og innovasjon
    • Forskning
    • Innovasjon
    • Satsingsområder
    • Toppforskning
    • Ekspertlister
    • Ph.d.
  • Om NTNU
    • Fakulteter og institutter
    • Sentre
    • Bibliotek
    • Kart
    • Ledige stillinger
    • Arrangement
    • Nyheter
    • Kontakt oss
    • Om NTNU
  1. Ansatte

Språkvelger

English

Torbjørn Karl Svendsen

Last ned pressefoto
Last ned pressefoto
Foto: Kai T. Dragland / NTNU

Torbjørn Karl Svendsen

Professor

torbjorn.svendsen@ntnu.no
73591481 93080477 Elektro C, C335, Gløshaugen, O. S. Bragstads plass 2
Om Publikasjoner Undervisning Formidling

Om

CV

Torbjørn Svendsen (1955) er professor ved Institutt for elektroniske systemer.

Han er utdannet både sivilingeniør og doktor ingeniør ved NTNU.

 

Se hans engelske side for mer informasjon.

Kompetanseord

  • Biometri
  • Digital signalbehandling
  • Kunstig intelligens
  • Mann maskin stystem
  • Maskinlæring
  • Mønstergjenkjenning
  • Signalbehandling
  • Språkressurser
  • Språkteknologi
  • Talegjenkjenning

Publikasjoner

  • Kronologisk
  • Etter kategori
  • Alle publikasjoner i Nasjonalt vitenarkiv (NVA)

2025

  • Parsons, Phoebe Luree Turner; Bremnes, Heming Strømholt; Kvale, Knut; Svendsen, Torbjørn; Salvi, Giampiero. (2025) Effects of Prosodic Information on Dialect Classification Using Whisper Features.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Fan, Zijian; Cao, Xinwei; Salvi, Giampiero; Svendsen, Torbjørn. (2025) Improving Phone Recognition through Informed Initialization and Path-Aligned CTC Loss.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Cao, Xinwei; Fan, Zijian; Svendsen, Torbjørn; Salvi, Giampiero. (2025) Child speech assessment through large language model speech synthesis: Preliminary results.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Dymbe, Simen; Siniscalchi, Sabato Marco; Svendsen, Torbjørn; Salvi, Giampiero. (2025) Using Cross-Attention for Conversational ASR over the Telephone.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Rugayan, Janine Lizbeth Cabrera; Salvi, Giampiero; Svendsen, Torbjørn Karl. (2025) Optimizing ASR Models with Semantic Information.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Parsons, Phoebe Luree Turner; Solberg, Per Erik; Kvale, Knut; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2025) Adding Metadata to Existing Parliamentary Speech Corpus.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Parsons, Phoebe Luree Turner; Kvale, Knut; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2025) Match ‘em: Multi-Tiered Alignment for Error Analysis in ASR.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

2024

  • Cao, Xinwei; Fan, Zijian; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2024) A Framework for Phoneme-Level Pronunciation Assessment Using CTC. Interspeech
    Vitenskapelig artikkel
  • Fan, Zijian; Cao, Xinwei; Salvi, Giampiero; Svendsen, Torbjørn Karl. (2024) Towards Better Recognition of Spontaneous Children's Speech: Speaker-Clustering Fine-Tuning of Whisper. Machine Learning for Signal Processing
    Vitenskapelig artikkel
  • Quatra, Moreno La; Turco, Maria Francesca; Svendsen, Torbjørn Karl; Salvi, Giampiero; Orozco-Arroyave, Juan Rafael; Siniscalchi, Sabato Marco. (2024) Exploiting Foundation Models and Speech Enhancement for Parkinson’s Disease Detection from Speech in Real-World Operative Conditions. Interspeech
    Vitenskapelig artikkel
  • Kynych, Frantisek; Cerva, Petr; Zdansky, Jindrich; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2024) A lightweight approach to real-time speaker diarization: from audio toward audio-visual data streams. EURASIP Journal on Audio, Speech, and Music Processing
    Vitenskapelig artikkel
  • Olstad, Anne Marte Haug; Smolander, Anna; Strömbergsson, Sofia; Ylinen, Sari; Lehtonen, Minna; Kurimo, Mikko. (2024) Collecting Linguistic Resources for Assessing Children’s Pronunciation of Nordic Languages. Proceedings of LREC
    Vitenskapelig artikkel

2023

  • Solberg, Per Erik; Cabello, Pablo Ortiz; Parsons, Phoebe; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2023) Improving Generalization of Norwegian ASR with Limited Linguistic Resources.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Parsons, Phoebe; Kvale, Knut; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2023) A character-based analysis of impacts of dialects on end-to-end Norwegian ASR.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Getman, Yaroslav; Phan, Nhan; Al-Ghezi, Ragheb; Voskoboinik, Ekaterina; Singh, Mittul; Grosz, Tamas. (2023) Developing an AI-Assisted Low-Resource Spoken Language Learning App for Children. IEEE Access
    Vitenskapelig artikkel
  • Rugayan, Janine Lizbeth Cabrera; Salvi, Giampiero; Svendsen, Torbjørn Karl. (2023) Perceptual and Task-Oriented Assessment of a Semantic Metric for ASR Evaluation. Interspeech (USB)
    Vitenskapelig artikkel
  • Gelderblom, Femke Berre; Tronstad, Tron Vedul; Svendsen, Torbjørn Karl; Myrvoll, Tor Andre. (2023) On the Predictive Power of Objective Intelligibility Metrics for the Subjective Performance of Deep Complex Convolutional Recurrent Speech Enhancement Networks. IEEE/ACM Transactions on Audio, Speech, and Language Processing (TASLP)
    Vitenskapelig artikkel
  • Fan, Zijian; Cao, Xinwei; Salvi, Giampiero; Svendsen, Torbjørn Karl. (2023) Using Modified Adult Speech as Data Augmentation for Child Speech Recognition. Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing
    Vitenskapelig artikkel
  • Cao, Xinwei; Fan, Zijian; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2023) An Analysis of Goodness of Pronunciation for Child Speech. Interspeech
    Vitenskapelig artikkel
  • Gelderblom, Femke Berre; Myrvoll, Tor Andre; Svendsen, Torbjørn Karl. (2023) Evaluating Performance Metrics for Deep Neural Network-based Speech Enhancement Systems. Norges teknisk-naturvitenskapelige universitet Norges teknisk-naturvitenskapelige universitet
    Doktorgradsavhandling

2022

  • Kvale, Knut; Gulla, Jon Atle; Adde, Line; Solberg, Per Erik; Svendsen, Torbjørn Karl; Moshagen, Sjur Nørstebø. (2022) Taleteknologi og kunstig intelligens. Teknologirådet Teknologirådet
    Rapport
  • Rugayan, Janine Lizbeth Cabrera; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2022) Semantically Meaningful Metrics for Norwegian ASR Systems. Interspeech (USB)
    Vitenskapelig artikkel
  • Getman, Yaroslav; Al-Ghezi, Ragheb; Voskoboinik, Ekaterina; Grósz, Tamás; Kurimo, Mikko; Salvi, Giampiero. (2022) wav2vec2-based Speech Rating System for Children with Speech Sound Disorder. Interspeech (USB)
    Vitenskapelig artikkel

2021

  • Shahrebabaki, Abdolreza Sabzi; Salvi, Giampiero; Svendsen, Torbjørn Karl; Siniscalchi, Sabato Marco. (2021) Acoustic-to-Articulatory Mapping With Joint Optimization of Deep Speech Enhancement and Articulatory Inversion Models. IEEE/ACM Transactions on Audio, Speech, and Language Processing (TASLP)
    Vitenskapelig artikkel
  • Shahrebabaki, Abdolreza Sabzi; Siniscalchi, Sabato Marco; Svendsen, Torbjørn Karl. (2021) Raw Speech-to-Articulatory Inversion by Temporal Filtering and Decimation. Interspeech
    Vitenskapelig artikkel
  • Shahrebabaki, Abdolreza Sabzi; Olfati, Negar; Imran, Ali Shariq; Johnsen, Magne Hallstein; Siniscalchi, Sabato Marco; Svendsen, Torbjørn Karl. (2021) A Two-Stage Deep Modeling Approach to Articulatory Inversion.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Shahrebabaki, Abdolreza Sabzi; Siniscalchi, Sabato Marco; Salvi, Giampiero; Svendsen, Torbjørn Karl. (2021) A DNN Based Speech Enhancement Approach to Noise Robust Acoustic-to-Articulatory Inversion.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

2020

  • Shahrebabaki, Abdolreza Sabzi; Olfati, Negar; Siniscalchi, Sabato Marco; Salvi, Giampiero; Svendsen, Torbjørn. (2020) Transfer learning of articulatory information through phone information. Interspeech (USB)
    Vitenskapelig artikkel
  • Shahrebabaki, Abdolreza Sabzi; Siniscalchi, Marco; Salvi, Giampiero; Svendsen, Torbjørn Karl. (2020) Sequence-to-sequence articulatory inversion through time convolution of sub-band frequency signals. Interspeech (USB)
    Vitenskapelig artikkel

2019

  • Shahrebabaki, Abdolreza Sabzi; Olfati, Negar; Imran, Ali Shariq; Marco, Siniscalchi Sabato; Svendsen, Torbjørn Karl. (2019) A Phonetic-Level Analysis of Different Input Features for Articulatory Inversion. Interspeech (USB)
    Vitenskapelig artikkel
  • Imran, Ali Shariq; Haflan, Vetle; Shahrebabaki, Abdolreza Sabzi; Olfati, Negar; Svendsen, Torbjørn Karl. (2019) Evaluating Acoustic Feature Maps in 2D-CNN for Speaker Identification.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Imran, Ali Shariq; Shahrebabaki, Abdolreza Sabzi; Olfati, Negar; Svendsen, Torbjørn Karl. (2019) A Study on the Performance Evaluation of Machine Learning Models for Phoneme Classification.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Imran, Ali Shariq; Kastrati, Zenun; Svendsen, Torbjørn Karl; Kurti, Arianit. (2019) Text-Independent Speaker ID for Automatic Video Lecture Classification Using Deep Learning.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Shahrebabaki, Abdolreza Sabzi; Imran, Ali Shariq; Olfati, Negar; Svendsen, Torbjørn Karl. (2019) A Comparative Study of Deep Learning Techniques on Frame-Level Speech Data Classification. Circuits, systems, and signal processing
    Vitenskapelig artikkel

2018

  • Shahrebabaki, Abdolreza Sabzi; Imran, Ali Shariq; Olfati, Negar; Svendsen, Torbjørn Karl. (2018) Acoustic Feature Comparison for Different Speaking Rates.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

2015

  • Næss, Arild Brandrud; Svendsen, Torbjørn Karl; Livescu, Karen. (2015) Nearest Neighbor Frame Classification for Articulatory Speech Recognition. Norges teknisk-naturvitenskapelige universitet Norges teknisk-naturvitenskapelige universitet
    Doktorgradsavhandling
  • Svendsen, Torbjørn Karl; Hamar, Jarle Bauck. (2015) Combining NdHMM and Phonetic Feature Detection for Speech Recognition.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

2014

  • Siniscalchi, Sabato Marco; Svendsen, Torbjørn; Lee, Chin-Hui. (2014) An artificial neural network approach to automatic speech processing. Neurocomputing
    Vitenskapelig artikkel
  • Soufifar, Mehdi; Svendsen, Torbjørn; Burget, Lukas. (2014) Subspace Modeling of Discrete Features for Language Recognition. Norges teknisk-naturvitenskapelige universitet Norges teknisk-naturvitenskapelige universitet
    Doktorgradsavhandling

2013

  • Hamar, Jarle Bauck; Doddipatla, Rama Sanand; Svendsen, Torbjørn; Sreenivas, Thippur. (2013) Non-Negative Durational HMM.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Doddipatla, Rama Sanand; Svendsen, Torbjørn. (2013) Synthetic Speaker Models Using VTLN to Improve the Performance of Children in Mismatched Speaker Conditions for ASR. Interspeech (USB)
    Vitenskapelig artikkel

2012

  • Siniscalchi, Sabato Marco; Reed, Jeremy; Svendsen, Torbjørn; Lee, Chin-Hui. (2012) Universal attribute characterization of spoken languages for automatic spoken language recognition. Computer Speech and Language
    Vitenskapelig artikkel
  • Siniscalchi, Sabato Marco; Lyu, DC; Svendsen, Torbjørn; Lee, CH. (2012) Experiments on Cross-Language Attribute Detection and Phone Recognition With Minimal Target-Specific Training Data. IEEE Transactions on Audio, Speech, and Language Processing
    Vitenskapelig artikkel

2011

  • Adde, Line; Svendsen, Torbjørn. (2011) Pronunciation Variation Modeling of Non-Natie Proper Names by Discriminative Tree Search. Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing
    Vitenskapelig artikkel
  • Kvale, Knut; Nordgård, Torbjørn; Svendsen, Torbjørn; Lyse, Gunn Inger; Gjesdal, Anje Müller. (2011) Datamaskinen må skjønne norsk.
    Kronikk
  • Siniscalchi, Sabato Marco; Svendsen, Torbjørn; Lee, Chin-Hui. (2011) A Bottom-Up Stepwise Knowledge-Integration Approach to Large Vocabulary Continuous Speech Recognition Using Weighted Finite State Machines. Interspeech
    Vitenskapelig artikkel
  • Soufifar, Mehdi; Kockmann, Marcel; Burget, Lukas; Plchot, Oldrich; Glembek, Ondrej; Svendsen, Torbjørn. (2011) iVector Approach to Phonotactic Language Recognition. Interspeech
    Vitenskapelig artikkel
  • Skogstad, Trond; Svendsen, Torbjørn. (2011) Frequency-Warped and Stabilized Time-Varying Cepstral Coefficients. Interspeech
    Vitenskapelig artikkel

2010

  • Siniscalchi, Sabato Marco; Svendsen, Torbjørn; Sorbello, Filippo; Lee, Chin-Hui. (2010) Experimental Studies on Continuous Speech Recognition Using Neural Architectures with ‘Adaptive’ Hidden Activation Functions. Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing
    Vitenskapelig artikkel
  • Adde, Line; Reveil, Bert; Martens, Jean-Pierre; Svendsen, Torbjørn. (2010) A Minimum Classification Error Approach to Pronunciation Variation Modeling of Non-Native Proper Names. Interspeech
    Vitenskapelig artikkel
  • Skogstad, Trond; Svendsen, Torbjørn. (2010) Intra-Frame Variability As a Predictor of Frame Classifiability. Interspeech
    Vitenskapelig artikkel
  • Siniscalchi, Sabato Marco; Reed, Jeremy; Svendsen, Torbjørn; Lee, Chin-Hui. (2010) Exploiting Context-Dependency and Acoustic Resolution of Universal Speech Attribute Models in Spoken Language Recognition. Interspeech
    Vitenskapelig artikkel
  • Adde, Line; Svendsen, Torbjørn. (2010) NameDat: A Database of English Proper Names Spoken by Native Norwegians.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

2009

  • Mertens, Timo Pascal; Schneider, Daniel; Næss, Arild Brandrud; Svendsen, Torbjørn. (2009) Lexicon Adaptation for Subword Speech Recognition.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Siniscalchi, Sabato Marco; Svendsen, Torbjørn; Lee, Chin-Hui. (2009) A Phonetic Feature Based Lattice Rescoring Approach to LVCSR. Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing
    Vitenskapelig artikkel
  • Siniscalchi, Sabato Marco; Reed, Jeremy; Svendsen, Torbjørn; Lee, Chin-Hui. (2009) Exploring Universal Attribute Characterization of Spoken Languages for Spoken Language Recognition. Interspeech
    Vitenskapelig artikkel

2008

  • Amdal, Ingunn; Strand, Ole Morten; Almberg, Jørn; Svendsen, Torbjørn. (2008) RUNDKAST: An Annotated Norwegian Broadcast News Speech Corpus.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Siniscalchi, Sabato Marco; Svendsen, Torbjørn; lee, chin-hui. (2008) A Penalized Logistic Regression Approach to Detection Based Phone Classification. Interspeech
    Vitenskapelig artikkel

2007

  • Siniscalchi, Sabato Marco; Svendsen, Torbjørn; Lee, Chin-Hui. (2007) Towards Bottom-Up Continuous Phone Recognition.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

2006

  • Amdal, Ingunn; Svendsen, Torbjørn. (2006) FonDat1: A Speech Synthesis Corpus for Norwegian.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Amdal, Ingunn; Johnsen, Magne Hallstein; Svendsen, Torbjørn. (2006) Log Likelihood Ratio Based Annotation Verification of a Norwegian Speech Synthesis Database.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

2005

  • Bjørkan, Ingmund; Svendsen, Torbjørn; Farner, Snorre. (2005) Comparing Spectral Distance Measures for Join Cost Optimization in Concatenative Speech Synthesis. Eurospeech : Proceedings of the European Conference on Speech Communication and Technology
    Vitenskapelig artikkel
  • Skogstad, Trond; Svendsen, Torbjørn. (2005) Distributed ASR Using Speech Coder Data for Efficient Feature Vector Representation. Eurospeech : Proceedings of the European Conference on Speech Communication and Technology
    Vitenskapelig artikkel
  • Bjørkan, Ingmund; Svendsen, Torbjørn. (2005) Comparing Spectral Distance Measures for Join Cost Optmization. Eurospeech : Proceedings of the European Conference on Speech Communication and Technology
    Vitenskapelig artikkel
  • Amdal, Ingunn; Svendsen, Torbjørn. (2005) Unit Selection Synthesis Database Development Using Utterance Verification. Eurospeech : Proceedings of the European Conference on Speech Communication and Technology
    Vitenskapelig artikkel
  • Meen, Dyre; Svendsen, Torbjørn; Natvig, Jon-Emil. (2005) Improving Phone Label Alignment Accuracy by Utilizing Voicing Information.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Svendsen, Torbjørn; Amdal, Ingunn; Bjørkan, Ingmund; Meen, Dyre; Heggtveit, Per Olav; Natvig, Jon Emil. (2005) FONEMA - Tools for realistic speech synthesis in Norwegian.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Svendsen, Torbjørn; Egeberg, Andreas; Holter, Trym; Skogstad, Trond. (2005) VOCALS - Voice centric user interfaces for location based services.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

2004

  • Nordgård, Torbjørn; Svendsen, Torbjørn; Harborg, Erik; Kvale, Knut. (2004) Language Technology Towards 2020.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

2003

  • Svendsen, Torbjørn. (2003) Speech Technology: Past, Present and Future. Telektronikk
    Vitenskapelig artikkel

2002

  • Svendsen, Torbjørn. (2002) Roles for Speech And Language Technology in The Information Society.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Nordgård, Torbjørn; Svendsen, Torbjørn; Natvig, Jon Emil. (2002) Talsmann talesyntese som hjelpemiddel for dyslektikere. Telenor Communication AS Telenor Communication AS
    Rapport
  • Nordgård, Torbjørn; Svendsen, Torbjørn; Breivik, Torbjørg. (2002) Samling og tilgjengeleggjering av norske språkteknologiressursar. Norsk språkråd Norsk språkråd
    Rapport

2001

  • Svendsen, Torbjørn. (2001) Nordisk forskningssamarbeid innen språkteknologi. Språknytt
    Populærvitenskapelig artikkel

2000

  • Amdal, Ingunn; Holter, Trym; Svendsen, Torbjørn. (2000) Modellering av uttalevariasjon for automatisk talegjenkjenning. Nordlyd
    Vitenskapelig artikkel
  • Foldvik, Arne Kjell; Nordgård, Torbjørn; Svendsen, Torbjørn; Thygesen, Ragnar. (2000) Dysleksi og språkteknologi.
    Kronikk

1999

  • Svendsen, Torbjørn. (1999) Taleteknologi. Språk i Norden
    Vitenskapelig artikkel
  • Holter, Trym; Svendsen, Torbjørn. (1999) Maximum likelihood modelling of pronunciation variation. Speech Communication
    Vitenskapelig artikkel
  • Svendsen, Torbjørn; Johnsen, Magne Hallstein; Nordgård, Torbjørn; Hofland, Knut; Hofland, Knut; Ore, Christian Emil. (1999) Nasjonalt korpus for språkteknologi - forprosjekt. Norges forskningsråd Norges forskningsråd
    Rapport

1998

  • Svendsen, Torbjørn. (1998) Blir norsk gresk for språkteknologien?. Språknytt
    Vitenskapelig artikkel

1995

  • Harborg, Erik; Johnsen, Magne Hallstein; Svendsen, Torbjørn. (1995) Talegjenkjenning II. SINTEF DELAB SINTEF DELAB
    Rapport
  • Harborg, Erik; Johnsen, Magne Hallstein; Svendsen, Torbjørn. (1995) Talegjenkjenning for teksting av direktesendte programmer - en studie. SINTEF DELAB SINTEF DELAB
    Rapport

1994

  • Svendsen, Torbjørn. (1994) Talebaserte brukergrensesnitt. NORSIGnalet : organ for NORSIG, Norsk forening for signalbehandling
    Populærvitenskapelig artikkel

Tidsskriftspublikasjoner

  • Cao, Xinwei; Fan, Zijian; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2024) A Framework for Phoneme-Level Pronunciation Assessment Using CTC. Interspeech
    Vitenskapelig artikkel
  • Fan, Zijian; Cao, Xinwei; Salvi, Giampiero; Svendsen, Torbjørn Karl. (2024) Towards Better Recognition of Spontaneous Children's Speech: Speaker-Clustering Fine-Tuning of Whisper. Machine Learning for Signal Processing
    Vitenskapelig artikkel
  • Quatra, Moreno La; Turco, Maria Francesca; Svendsen, Torbjørn Karl; Salvi, Giampiero; Orozco-Arroyave, Juan Rafael; Siniscalchi, Sabato Marco. (2024) Exploiting Foundation Models and Speech Enhancement for Parkinson’s Disease Detection from Speech in Real-World Operative Conditions. Interspeech
    Vitenskapelig artikkel
  • Kynych, Frantisek; Cerva, Petr; Zdansky, Jindrich; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2024) A lightweight approach to real-time speaker diarization: from audio toward audio-visual data streams. EURASIP Journal on Audio, Speech, and Music Processing
    Vitenskapelig artikkel
  • Olstad, Anne Marte Haug; Smolander, Anna; Strömbergsson, Sofia; Ylinen, Sari; Lehtonen, Minna; Kurimo, Mikko. (2024) Collecting Linguistic Resources for Assessing Children’s Pronunciation of Nordic Languages. Proceedings of LREC
    Vitenskapelig artikkel
  • Getman, Yaroslav; Phan, Nhan; Al-Ghezi, Ragheb; Voskoboinik, Ekaterina; Singh, Mittul; Grosz, Tamas. (2023) Developing an AI-Assisted Low-Resource Spoken Language Learning App for Children. IEEE Access
    Vitenskapelig artikkel
  • Rugayan, Janine Lizbeth Cabrera; Salvi, Giampiero; Svendsen, Torbjørn Karl. (2023) Perceptual and Task-Oriented Assessment of a Semantic Metric for ASR Evaluation. Interspeech (USB)
    Vitenskapelig artikkel
  • Gelderblom, Femke Berre; Tronstad, Tron Vedul; Svendsen, Torbjørn Karl; Myrvoll, Tor Andre. (2023) On the Predictive Power of Objective Intelligibility Metrics for the Subjective Performance of Deep Complex Convolutional Recurrent Speech Enhancement Networks. IEEE/ACM Transactions on Audio, Speech, and Language Processing (TASLP)
    Vitenskapelig artikkel
  • Fan, Zijian; Cao, Xinwei; Salvi, Giampiero; Svendsen, Torbjørn Karl. (2023) Using Modified Adult Speech as Data Augmentation for Child Speech Recognition. Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing
    Vitenskapelig artikkel
  • Cao, Xinwei; Fan, Zijian; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2023) An Analysis of Goodness of Pronunciation for Child Speech. Interspeech
    Vitenskapelig artikkel
  • Rugayan, Janine Lizbeth Cabrera; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2022) Semantically Meaningful Metrics for Norwegian ASR Systems. Interspeech (USB)
    Vitenskapelig artikkel
  • Getman, Yaroslav; Al-Ghezi, Ragheb; Voskoboinik, Ekaterina; Grósz, Tamás; Kurimo, Mikko; Salvi, Giampiero. (2022) wav2vec2-based Speech Rating System for Children with Speech Sound Disorder. Interspeech (USB)
    Vitenskapelig artikkel
  • Shahrebabaki, Abdolreza Sabzi; Salvi, Giampiero; Svendsen, Torbjørn Karl; Siniscalchi, Sabato Marco. (2021) Acoustic-to-Articulatory Mapping With Joint Optimization of Deep Speech Enhancement and Articulatory Inversion Models. IEEE/ACM Transactions on Audio, Speech, and Language Processing (TASLP)
    Vitenskapelig artikkel
  • Shahrebabaki, Abdolreza Sabzi; Siniscalchi, Sabato Marco; Svendsen, Torbjørn Karl. (2021) Raw Speech-to-Articulatory Inversion by Temporal Filtering and Decimation. Interspeech
    Vitenskapelig artikkel
  • Shahrebabaki, Abdolreza Sabzi; Olfati, Negar; Siniscalchi, Sabato Marco; Salvi, Giampiero; Svendsen, Torbjørn. (2020) Transfer learning of articulatory information through phone information. Interspeech (USB)
    Vitenskapelig artikkel
  • Shahrebabaki, Abdolreza Sabzi; Siniscalchi, Marco; Salvi, Giampiero; Svendsen, Torbjørn Karl. (2020) Sequence-to-sequence articulatory inversion through time convolution of sub-band frequency signals. Interspeech (USB)
    Vitenskapelig artikkel
  • Shahrebabaki, Abdolreza Sabzi; Olfati, Negar; Imran, Ali Shariq; Marco, Siniscalchi Sabato; Svendsen, Torbjørn Karl. (2019) A Phonetic-Level Analysis of Different Input Features for Articulatory Inversion. Interspeech (USB)
    Vitenskapelig artikkel
  • Shahrebabaki, Abdolreza Sabzi; Imran, Ali Shariq; Olfati, Negar; Svendsen, Torbjørn Karl. (2019) A Comparative Study of Deep Learning Techniques on Frame-Level Speech Data Classification. Circuits, systems, and signal processing
    Vitenskapelig artikkel
  • Siniscalchi, Sabato Marco; Svendsen, Torbjørn; Lee, Chin-Hui. (2014) An artificial neural network approach to automatic speech processing. Neurocomputing
    Vitenskapelig artikkel
  • Doddipatla, Rama Sanand; Svendsen, Torbjørn. (2013) Synthetic Speaker Models Using VTLN to Improve the Performance of Children in Mismatched Speaker Conditions for ASR. Interspeech (USB)
    Vitenskapelig artikkel
  • Siniscalchi, Sabato Marco; Reed, Jeremy; Svendsen, Torbjørn; Lee, Chin-Hui. (2012) Universal attribute characterization of spoken languages for automatic spoken language recognition. Computer Speech and Language
    Vitenskapelig artikkel
  • Siniscalchi, Sabato Marco; Lyu, DC; Svendsen, Torbjørn; Lee, CH. (2012) Experiments on Cross-Language Attribute Detection and Phone Recognition With Minimal Target-Specific Training Data. IEEE Transactions on Audio, Speech, and Language Processing
    Vitenskapelig artikkel
  • Adde, Line; Svendsen, Torbjørn. (2011) Pronunciation Variation Modeling of Non-Natie Proper Names by Discriminative Tree Search. Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing
    Vitenskapelig artikkel
  • Kvale, Knut; Nordgård, Torbjørn; Svendsen, Torbjørn; Lyse, Gunn Inger; Gjesdal, Anje Müller. (2011) Datamaskinen må skjønne norsk.
    Kronikk
  • Siniscalchi, Sabato Marco; Svendsen, Torbjørn; Lee, Chin-Hui. (2011) A Bottom-Up Stepwise Knowledge-Integration Approach to Large Vocabulary Continuous Speech Recognition Using Weighted Finite State Machines. Interspeech
    Vitenskapelig artikkel
  • Soufifar, Mehdi; Kockmann, Marcel; Burget, Lukas; Plchot, Oldrich; Glembek, Ondrej; Svendsen, Torbjørn. (2011) iVector Approach to Phonotactic Language Recognition. Interspeech
    Vitenskapelig artikkel
  • Skogstad, Trond; Svendsen, Torbjørn. (2011) Frequency-Warped and Stabilized Time-Varying Cepstral Coefficients. Interspeech
    Vitenskapelig artikkel
  • Siniscalchi, Sabato Marco; Svendsen, Torbjørn; Sorbello, Filippo; Lee, Chin-Hui. (2010) Experimental Studies on Continuous Speech Recognition Using Neural Architectures with ‘Adaptive’ Hidden Activation Functions. Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing
    Vitenskapelig artikkel
  • Adde, Line; Reveil, Bert; Martens, Jean-Pierre; Svendsen, Torbjørn. (2010) A Minimum Classification Error Approach to Pronunciation Variation Modeling of Non-Native Proper Names. Interspeech
    Vitenskapelig artikkel
  • Skogstad, Trond; Svendsen, Torbjørn. (2010) Intra-Frame Variability As a Predictor of Frame Classifiability. Interspeech
    Vitenskapelig artikkel
  • Siniscalchi, Sabato Marco; Reed, Jeremy; Svendsen, Torbjørn; Lee, Chin-Hui. (2010) Exploiting Context-Dependency and Acoustic Resolution of Universal Speech Attribute Models in Spoken Language Recognition. Interspeech
    Vitenskapelig artikkel
  • Siniscalchi, Sabato Marco; Svendsen, Torbjørn; Lee, Chin-Hui. (2009) A Phonetic Feature Based Lattice Rescoring Approach to LVCSR. Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing
    Vitenskapelig artikkel
  • Siniscalchi, Sabato Marco; Reed, Jeremy; Svendsen, Torbjørn; Lee, Chin-Hui. (2009) Exploring Universal Attribute Characterization of Spoken Languages for Spoken Language Recognition. Interspeech
    Vitenskapelig artikkel
  • Siniscalchi, Sabato Marco; Svendsen, Torbjørn; lee, chin-hui. (2008) A Penalized Logistic Regression Approach to Detection Based Phone Classification. Interspeech
    Vitenskapelig artikkel
  • Bjørkan, Ingmund; Svendsen, Torbjørn; Farner, Snorre. (2005) Comparing Spectral Distance Measures for Join Cost Optimization in Concatenative Speech Synthesis. Eurospeech : Proceedings of the European Conference on Speech Communication and Technology
    Vitenskapelig artikkel
  • Skogstad, Trond; Svendsen, Torbjørn. (2005) Distributed ASR Using Speech Coder Data for Efficient Feature Vector Representation. Eurospeech : Proceedings of the European Conference on Speech Communication and Technology
    Vitenskapelig artikkel
  • Bjørkan, Ingmund; Svendsen, Torbjørn. (2005) Comparing Spectral Distance Measures for Join Cost Optmization. Eurospeech : Proceedings of the European Conference on Speech Communication and Technology
    Vitenskapelig artikkel
  • Amdal, Ingunn; Svendsen, Torbjørn. (2005) Unit Selection Synthesis Database Development Using Utterance Verification. Eurospeech : Proceedings of the European Conference on Speech Communication and Technology
    Vitenskapelig artikkel
  • Svendsen, Torbjørn. (2003) Speech Technology: Past, Present and Future. Telektronikk
    Vitenskapelig artikkel
  • Svendsen, Torbjørn. (2001) Nordisk forskningssamarbeid innen språkteknologi. Språknytt
    Populærvitenskapelig artikkel
  • Amdal, Ingunn; Holter, Trym; Svendsen, Torbjørn. (2000) Modellering av uttalevariasjon for automatisk talegjenkjenning. Nordlyd
    Vitenskapelig artikkel
  • Foldvik, Arne Kjell; Nordgård, Torbjørn; Svendsen, Torbjørn; Thygesen, Ragnar. (2000) Dysleksi og språkteknologi.
    Kronikk
  • Svendsen, Torbjørn. (1999) Taleteknologi. Språk i Norden
    Vitenskapelig artikkel
  • Holter, Trym; Svendsen, Torbjørn. (1999) Maximum likelihood modelling of pronunciation variation. Speech Communication
    Vitenskapelig artikkel
  • Svendsen, Torbjørn. (1998) Blir norsk gresk for språkteknologien?. Språknytt
    Vitenskapelig artikkel
  • Svendsen, Torbjørn. (1994) Talebaserte brukergrensesnitt. NORSIGnalet : organ for NORSIG, Norsk forening for signalbehandling
    Populærvitenskapelig artikkel

Del av bok/rapport

  • Parsons, Phoebe Luree Turner; Bremnes, Heming Strømholt; Kvale, Knut; Svendsen, Torbjørn; Salvi, Giampiero. (2025) Effects of Prosodic Information on Dialect Classification Using Whisper Features.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Fan, Zijian; Cao, Xinwei; Salvi, Giampiero; Svendsen, Torbjørn. (2025) Improving Phone Recognition through Informed Initialization and Path-Aligned CTC Loss.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Cao, Xinwei; Fan, Zijian; Svendsen, Torbjørn; Salvi, Giampiero. (2025) Child speech assessment through large language model speech synthesis: Preliminary results.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Dymbe, Simen; Siniscalchi, Sabato Marco; Svendsen, Torbjørn; Salvi, Giampiero. (2025) Using Cross-Attention for Conversational ASR over the Telephone.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Rugayan, Janine Lizbeth Cabrera; Salvi, Giampiero; Svendsen, Torbjørn Karl. (2025) Optimizing ASR Models with Semantic Information.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Parsons, Phoebe Luree Turner; Solberg, Per Erik; Kvale, Knut; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2025) Adding Metadata to Existing Parliamentary Speech Corpus.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Parsons, Phoebe Luree Turner; Kvale, Knut; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2025) Match ‘em: Multi-Tiered Alignment for Error Analysis in ASR.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Solberg, Per Erik; Cabello, Pablo Ortiz; Parsons, Phoebe; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2023) Improving Generalization of Norwegian ASR with Limited Linguistic Resources.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Parsons, Phoebe; Kvale, Knut; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2023) A character-based analysis of impacts of dialects on end-to-end Norwegian ASR.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Shahrebabaki, Abdolreza Sabzi; Olfati, Negar; Imran, Ali Shariq; Johnsen, Magne Hallstein; Siniscalchi, Sabato Marco; Svendsen, Torbjørn Karl. (2021) A Two-Stage Deep Modeling Approach to Articulatory Inversion.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Shahrebabaki, Abdolreza Sabzi; Siniscalchi, Sabato Marco; Salvi, Giampiero; Svendsen, Torbjørn Karl. (2021) A DNN Based Speech Enhancement Approach to Noise Robust Acoustic-to-Articulatory Inversion.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Imran, Ali Shariq; Haflan, Vetle; Shahrebabaki, Abdolreza Sabzi; Olfati, Negar; Svendsen, Torbjørn Karl. (2019) Evaluating Acoustic Feature Maps in 2D-CNN for Speaker Identification.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Imran, Ali Shariq; Shahrebabaki, Abdolreza Sabzi; Olfati, Negar; Svendsen, Torbjørn Karl. (2019) A Study on the Performance Evaluation of Machine Learning Models for Phoneme Classification.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Imran, Ali Shariq; Kastrati, Zenun; Svendsen, Torbjørn Karl; Kurti, Arianit. (2019) Text-Independent Speaker ID for Automatic Video Lecture Classification Using Deep Learning.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Shahrebabaki, Abdolreza Sabzi; Imran, Ali Shariq; Olfati, Negar; Svendsen, Torbjørn Karl. (2018) Acoustic Feature Comparison for Different Speaking Rates.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Svendsen, Torbjørn Karl; Hamar, Jarle Bauck. (2015) Combining NdHMM and Phonetic Feature Detection for Speech Recognition.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Hamar, Jarle Bauck; Doddipatla, Rama Sanand; Svendsen, Torbjørn; Sreenivas, Thippur. (2013) Non-Negative Durational HMM.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Adde, Line; Svendsen, Torbjørn. (2010) NameDat: A Database of English Proper Names Spoken by Native Norwegians.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Mertens, Timo Pascal; Schneider, Daniel; Næss, Arild Brandrud; Svendsen, Torbjørn. (2009) Lexicon Adaptation for Subword Speech Recognition.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Amdal, Ingunn; Strand, Ole Morten; Almberg, Jørn; Svendsen, Torbjørn. (2008) RUNDKAST: An Annotated Norwegian Broadcast News Speech Corpus.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Siniscalchi, Sabato Marco; Svendsen, Torbjørn; Lee, Chin-Hui. (2007) Towards Bottom-Up Continuous Phone Recognition.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Amdal, Ingunn; Svendsen, Torbjørn. (2006) FonDat1: A Speech Synthesis Corpus for Norwegian.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Amdal, Ingunn; Johnsen, Magne Hallstein; Svendsen, Torbjørn. (2006) Log Likelihood Ratio Based Annotation Verification of a Norwegian Speech Synthesis Database.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Meen, Dyre; Svendsen, Torbjørn; Natvig, Jon-Emil. (2005) Improving Phone Label Alignment Accuracy by Utilizing Voicing Information.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Svendsen, Torbjørn; Amdal, Ingunn; Bjørkan, Ingmund; Meen, Dyre; Heggtveit, Per Olav; Natvig, Jon Emil. (2005) FONEMA - Tools for realistic speech synthesis in Norwegian.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Svendsen, Torbjørn; Egeberg, Andreas; Holter, Trym; Skogstad, Trond. (2005) VOCALS - Voice centric user interfaces for location based services.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Nordgård, Torbjørn; Svendsen, Torbjørn; Harborg, Erik; Kvale, Knut. (2004) Language Technology Towards 2020.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
  • Svendsen, Torbjørn. (2002) Roles for Speech And Language Technology in The Information Society.
    Vitenskapelig Kapittel/Artikkel/Konferanseartikkel

Rapport

  • Gelderblom, Femke Berre; Myrvoll, Tor Andre; Svendsen, Torbjørn Karl. (2023) Evaluating Performance Metrics for Deep Neural Network-based Speech Enhancement Systems. Norges teknisk-naturvitenskapelige universitet Norges teknisk-naturvitenskapelige universitet
    Doktorgradsavhandling
  • Kvale, Knut; Gulla, Jon Atle; Adde, Line; Solberg, Per Erik; Svendsen, Torbjørn Karl; Moshagen, Sjur Nørstebø. (2022) Taleteknologi og kunstig intelligens. Teknologirådet Teknologirådet
    Rapport
  • Næss, Arild Brandrud; Svendsen, Torbjørn Karl; Livescu, Karen. (2015) Nearest Neighbor Frame Classification for Articulatory Speech Recognition. Norges teknisk-naturvitenskapelige universitet Norges teknisk-naturvitenskapelige universitet
    Doktorgradsavhandling
  • Soufifar, Mehdi; Svendsen, Torbjørn; Burget, Lukas. (2014) Subspace Modeling of Discrete Features for Language Recognition. Norges teknisk-naturvitenskapelige universitet Norges teknisk-naturvitenskapelige universitet
    Doktorgradsavhandling
  • Nordgård, Torbjørn; Svendsen, Torbjørn; Natvig, Jon Emil. (2002) Talsmann talesyntese som hjelpemiddel for dyslektikere. Telenor Communication AS Telenor Communication AS
    Rapport
  • Nordgård, Torbjørn; Svendsen, Torbjørn; Breivik, Torbjørg. (2002) Samling og tilgjengeleggjering av norske språkteknologiressursar. Norsk språkråd Norsk språkråd
    Rapport
  • Svendsen, Torbjørn; Johnsen, Magne Hallstein; Nordgård, Torbjørn; Hofland, Knut; Hofland, Knut; Ore, Christian Emil. (1999) Nasjonalt korpus for språkteknologi - forprosjekt. Norges forskningsråd Norges forskningsråd
    Rapport
  • Harborg, Erik; Johnsen, Magne Hallstein; Svendsen, Torbjørn. (1995) Talegjenkjenning II. SINTEF DELAB SINTEF DELAB
    Rapport
  • Harborg, Erik; Johnsen, Magne Hallstein; Svendsen, Torbjørn. (1995) Talegjenkjenning for teksting av direktesendte programmer - en studie. SINTEF DELAB SINTEF DELAB
    Rapport

Undervisning

Emner

  • TT8108 - Doktorgradsseminar i signalbehandling

Formidling

2025

  • Vitenskapelig foredrag
    Parsons, Phoebe Luree Turner; Solberg, Per Erik; Kvale, Knut; Svendsen, Torbjørn; Salvi, Giampiero. (2025) Adding Metadata to Existing Parliamentary Speech Corpus. Proceedings of the Joint 25th Nordic Conference on Computational Linguistics and 11th Baltic Conference on Human Language Technologies (NoDaLiDa/Baltic-HLT 2025) 2025-03-01 - 2025-03-03
  • Vitenskapelig foredrag
    Parsons, Phoebe Luree Turner; Kvale, Knut; Svendsen, Torbjørn. (2025) Match ‘em: Multi-Tiered Alignment for Error Analysis in ASR. Proceedings of the Joint 25th Nordic Conference on Computational Linguistics and 11th Baltic Conference on Human Language Technologies (NoDaLiDa/Baltic-HLT 2025) 2025-03-02 - 2025-03-03
  • Vitenskapelig foredrag
    Parsons, Phoebe Luree Turner; Bremnes, Heming Strømholt; Kvale, Knut; Svendsen, Torbjørn; Salvi, Giampiero. (2025) Effects of Prosodic Information on Dialect Classification Using Whisper Features. Interspeech 2025 2025-08-16 - 2025-08-20
  • Vitenskapelig foredrag
    Rugayan, Janine Lizbeth Cabrera; Salvi, Giampiero; Svendsen, Torbjørn. (2025) Optimizing ASR Models with Semantic Information. Text, Speech and Dialogue 2025-08-24 - 2025-08-27
  • Vitenskapelig foredrag
    Dymbe, Simen; Siniscalchi, Sabato Marco; Svendsen, Torbjørn; Salvi, Giampiero. (2025) Using Cross-Attention for Conversational ASR over the Telephone. Text, Speech and Dialogue 2025-08-24 - 2025-08-27
  • Vitenskapelig foredrag
    Fan, Zijian; Cao, Xinwei; Salvi, Giampiero; Svendsen, Torbjørn. (2025) Improving Phone Recognition through Informed Initialization and Path-Aligned CTC Loss. 2025 IEEE 35th International Workshop on Machine Learning for Signal Processing (MLSP) 2025-08-30 - 2025-09-02
  • Vitenskapelig foredrag
    Cao, Xinwei; Fan, Zijian; Svendsen, Torbjørn; Salvi, Giampiero. (2025) Child speech assessment through large language model speech synthesis: Preliminary results. 2025 IEEE 35th International Workshop on Machine Learning for Signal Processing (MLSP) 2025-08-30 - 2025-09-02

2024

  • Vitenskapelig foredrag
    Fan, Zijian; Cao, Xinwei; Salvi, Giampiero; Svendsen, Torbjørn Karl. (2024) Towards Better Recognition of Spontaneous Children's Speech: Speaker-Clustering Fine-Tuning of Whisper. chine Learning for Signal Processing , London, UK 2024-09-22 - 2024-09-25
  • Vitenskapelig foredrag
    Cao, Xinwei; Fan, Zijian; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2024) Framework for Phoneme-Level Pronunciation Assessment Using CTC. Interspeech , Kos, Greece 2024-09-01 - 2024-09-05
  • Vitenskapelig foredrag
    Parsons, Phoebe Luree Turner; Bremnes, Heming Strømholt; Kvale, Knut; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2024) Norwegian dialect identification: is prosody enough?. Fonetik , Stockholm 2024-06-03 - 2024-06-05
  • Faglig foredrag
    Svendsen, Torbjørn Karl. (2024) Kunstig intelligens - hva, hvorfor, hvordan. Folkeakademiet , Hyllestad kommunehus 2024-04-04 - 2024-04-04
  • Faglig foredrag
    Svendsen, Torbjørn Karl. (2024) Hva er kunstig intelligens? Muligheter for KI i eiendomsbransjen. Internseminar , Trondheim 2024-03-18 - 2024-03-18
  • Faglig foredrag
    Svendsen, Torbjørn Karl. (2024) Machines may "think" - but can they master the spoken language?. Friday talk , Trondheim 2024-01-26 - 2024-01-26
  • Faglig foredrag
    Svendsen, Torbjørn Karl. (2024) What is spoken language technology?. From Toys to Tools to Terror(ist?) in a decade , Trondheim 2024-01-26 - 2024-01-26

2023

  • Vitenskapelig foredrag
    Parsons, Phoebe Luree Turner; Kvale, Knut; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2023) A character-based analysis of impacts of dialects on end-to-end Norwegian ASR. 24th Nordic Conference on Computational Linguistics (NoDaLiDa) , Tórshavn, Faroe Islands 2023-05-14 - 2023-05-18
  • Vitenskapelig foredrag
    Rugayan, Janine Lizbeth Cabrera; Salvi, Giampiero; Svendsen, Torbjørn Karl. (2023) Perceptual and Task-Oriented Assessment of a Semantic Metric for ASR Evaluation. Interspeech , Dublin, Irland 2023-08-20 - 2023-08-24
  • Vitenskapelig foredrag
    Fan, Zijian; Cao, Xinwei; Salvi, Giampiero; Svendsen, Torbjørn Karl. (2023) Using Modified Adult Speech as Data Augmentation for Child Speech Recognition. ICASSP , Rhodes, Greece 2023-06-04 - 2023-06-10
  • Vitenskapelig foredrag
    Cao, Xinwei; Fan, Zijian; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2023) An Analysis of Goodness of Pronunciation for Child Speech. Interspeech , Dublin, Irland 2023-08-20 - 2023-08-24
  • Vitenskapelig foredrag
    Svendsen, Torbjørn Karl. (2023) Joint MAP of Direct and Indirect Adaptation. Symposium for Celebrating 40 Years of Bayesian Learning in Speech and Language Processing and Beyond , Taipei 2023-12-20 - 2023-12-20
  • Vitenskapelig foredrag
    Svendsen, Torbjørn Karl. (2023) Combining direct and indirect adaptation for speech recognition. Seminar on speech technology , National Taiwan University 2023-12-21 - 2023-12-21
  • Vitenskapelig foredrag
    Svendsen, Torbjørn Karl. (2023) Speech Signal Processing. Speech DSP , Enna 2023-03-22 - 2023-03-23
  • Vitenskapelig foredrag
    Solberg, Per Erik; Cabello, Pablo Ortiz; Parsons, Phoebe Luree Turner; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2023) Improving Generalization of Norwegian ASR with Limited Linguistic Resources. 24th Nordic Conference on Computational Linguistics (NoDaLiDa) , Tórshavn, Faroe Islands 2023-05-15 - 2023-05-18

2022

  • Vitenskapelig foredrag
    Getman, Yaroslav; Al-Ghezi, Ragheb; Voskoboinik, Ekaterina; Grósz, Tamás; Kurimo, Mikko; Salvi, Giampiero. (2022) wav2vec2-based Speech Rating System for Children with Speech Sound Disorder. Interspeech , Incheon, Korea 2022-09-18 - 2022-09-22
  • Vitenskapelig foredrag
    Rugayan, Janine Lizbeth Cabrera; Svendsen, Torbjørn Karl; Salvi, Giampiero. (2022) Semantically Meaningful Metrics for Norwegian ASR Systems. Interspeech , Incheon, Korea 2022-09-18 - 2022-09-22

2018

  • Faglig foredrag
    Øien, Geir Egil Dahle; Mengshoel, Ole Jakob; Ramampiaro, Heri; Svendsen, Torbjørn Karl. (2018) NTNUs strategiske satsing på kunstig intelligens (AI) – bakgrunn, aktiviteter og fremtidsvyer. Medlemsmøte, Det Kongelige Norske Vitenskapers Selskap , Trondheim 2018-11-12 - 2018-11-12

2012

  • Intervju
    Svendsen, Torbjørn. (2012) Data med barnestemme. Forskning.no Forskning.no [null] 2012-12-05

2011

  • Vitenskapelig foredrag
    Rodriguez-Fuentes, Luis Javier; Penagarikano, Mikel; Varona, Amparo; Diez, Mireia; Bordel, German; Martinez, David. (2011) MULTI-SITE HETEROGENEOUS SYSTEM FUSIONS FOR THE ALBAYZIN 2010 LANGUAGE RECOGNITION EVALUATION. Automatic Speech Recognition and Understanding , Big Island, Hawaii 2011-12-11 - 2011-12-15
  • Faglig foredrag
    Svendsen, Torbjørn. (2011) Hva er det med tale? Forskningsutfordringer og aktiviteter innen taleteknologi. På snakkis med teknologien , Oslo 2011-11-09 - 2011-11-09
  • Vitenskapelig foredrag
    Svendsen, Torbjørn. (2011) Universal Speech Attribute Characterization for Automatic Speech Recognition and Spoken Language Recognition. CSAIL Seminar , Boston 2011-12-05 - 2011-12-05

2010

  • Vitenskapelig foredrag
    Siniscalchi, Sabato Marco; Svendsen, Torbjørn; Sorbello, Filippo; Lee, Chin-Hui. (2010) Experimental Studies on Continuous Speech Recognition Using Neural Architectures with ‘Adaptive’ Hidden Activation Functions. ICASSP 2010 , Dallas, Texas 2010-03-14 - 2010-03-19
  • Vitenskapelig foredrag
    Saeidi, Rahim; Soufifar, Mehdi; Kinnunen, Tomi; Svendsen, Torbjørn; Fränti, Pasi. (2010) UEF-NTNU System Description for Albayzin 2010 Language Recognition Evaluation. FALA 2010 , Vigo 2010-10-10 - 2010-10-12
  • Vitenskapelig foredrag
    Siniscalchi, Sabato Marco; Svendsen, Torbjørn; Lee, Chin-Hui. (2010) A Survey on Recent Progress in the ASAT/SIRKUS Paradigm. ISCSLP 2010 , Tainan 2010-11-21 - 2010-12-03
  • Vitenskapelig foredrag
    Siniscalchi, Sabato Marco; Reed, Jeremy; Svendsen, Torbjørn; Lee, Chin-Hui. (2010) Exploiting Context-Dependency and Acoustic Resolution of Universal Speech Attribute Models in Spoken Language Recognition. Interspeech 2010 , Makuhari 2010-09-27 - 2010-09-30
  • Vitenskapelig foredrag
    Skogstad, Trond; Svendsen, Torbjørn. (2010) Intra-Frame Variability As a Predictor of Frame Classifiability. Interspeech 2010 , Makuhari 2010-09-27 - 2010-09-30
  • Vitenskapelig foredrag
    Sikveland, Rein Ove; Öttl, Anton; Amdal, Ingunn; Ernestus, Mirjam; Svendsen, Torbjørn; Edlund, Jens. (2010) Spontal-N: A Corpus of Interactional Spoken Norwegian. LREC , Valetta 2010-05-17 - 2010-05-23
  • Vitenskapelig foredrag
    Adde, Line; Reveil, Bert; Martens, Jean-Pierre; Svendsen, Torbjørn. (2010) A Minimum Classification Error Approach to Pronunciation Variation Modeling of Non-Native Proper Names. Interspeech 2010 , Makuhari 2010-09-27 - 2010-09-30
  • Vitenskapelig foredrag
    Meen, Dyre; Svendsen, Torbjørn. (2010) The NTNU Concatenative Speech Synthesizer. Blizzard Challenge Workshop , Kyoto 2010-09-25 - 2010-09-25
  • Vitenskapelig foredrag
    Adde, Line; Svendsen, Torbjørn. (2010) NameDat: A Database of English Proper Names Spoken by Native Norwegians. LREC , Valetta 2010-05-17 -
  • Vitenskapelig foredrag
    Adde, Line; Svendsen, Torbjørn. (2010) A Comparative Analysis of Discriminative and Non-Discriminative Pronunciation Priors in Pronunciation Variation Modeling. IEEE Workshop on Spoken Language Technology 2010 , Berkeley, California 2010-12-12 - 2010-12-15

2009

  • Intervju
    Svendsen, Torbjørn. (2009) Språkteknologien gjør fremskritt igjen. forskning.no forskning.no [null] 2009-04-09
  • Intervju
    Svendsen, Torbjørn. (2009) VERDIKT på Forskningsdagene. Nytt fra VERDIKT Nytt fra VERDIKT [null] 2009-11-03
  • Vitenskapelig foredrag
    Siniscalchi, Sabato Marco; Reed, Jeremy; Svendsen, Torbjørn; Lee, Chin-Hui. (2009) Exploring Universal Attribute Characterization of Spoken Languages for Spoken Language Recognition. Interspeech , Brighton 2009-09-06 - 2009-09-10
  • Vitenskapelig foredrag
    Siniscalchi, Sabato Marco; Svendsen, Torbjørn; Lee, Chin-Hui. (2009) A Phonetic Feature Based Lattice Rescoring Approach to LVCSR. IEEE International Conference on Acoustics, Speech and Signal Processing , Taipei 2009-04-19 - 2009-04-24

2008

  • Intervju
    Svendsen, Torbjørn. (2008) Norsk talesyntese. P4 P4 [null] 2008-02-08
  • Intervju
    Svendsen, Torbjørn. (2008) Taleteknologi. God morgen Norge God morgen Norge [null] 2008-02-08
  • Vitenskapelig foredrag
    Amdal, Ingunn; Strand, Ole Morten; Almberg, Jørn; Svendsen, Torbjørn. (2008) RUNDKAST: An Annotated Norwegian Broadcast News Speech Corpus. LREC 2008 , Marrakech 2008-05-26 - 2008-05-31
  • Vitenskapelig foredrag
    Amdal, Ingunn; Svendsen, Torbjørn; Johnsen, Magne Hallstein; Siniscalchi, Sabato Marco; Hamar, Jarle Bauck; Martinez, Del Hoyo Canterla A.. (2008) SIRKUS - A new paradigm for speech recognition. VERDIKT Conference 2008 , Bergen 2008-10-29 - 2008-10-30
  • Vitenskapelig foredrag
    Siniscalchi, Sabato Marco; Svendsen, Torbjørn; lee, chin-hui. (2008) Toward a Detector-Based Universal Phone Recognizer. International Conference on Acoustics, Speech and Signal Processing , Las Vegas 2008-03-30 - 2008-04-04
  • Vitenskapelig foredrag
    Skogstad, Trond; Svendsen, Torbjørn. (2008) Time-Varying Cepstral Coefficients. ISCA ITRW on Speech Analysis and Processing for Knowledge Discovery , Aalborg 2008-06-04 - 2008-06-06
  • Vitenskapelig foredrag
    Siniscalchi, Sabato Marco; Birkenes, Øystein; Johnsen, Magne Hallstein; Svendsen, Torbjørn. (2008) Joint Optimization of Event Detectors and Evidence Merger for Continuous Speech Recognition. ISCA ITRW on Speech Analysis and Processing for Knowledge Discovery , Aalborg 2008-06-04 - 2008-06-06
  • Vitenskapelig foredrag
    Siniscalchi, Sabato Marco; Svendsen, Torbjørn; lee, chin-hui. (2008) A Penalized Logistic Regression Approach to Detection Based Phone Classification. Interspeech 2008 , Brisbane 2008-09-22 - 2008-09-26
  • Intervju
    Svendsen, Torbjørn. (2008) Norsk språkbank. Språkteigen, NRK P2 Språkteigen, NRK P2 [null] 2008-08-24

2007

  • Intervju
    Svendsen, Torbjørn; Abelsen, Atle. (2007) IKE i hver puslebit. Bladet Forskning Bladet Forskning [null] 2007-12-01
  • Vitenskapelig foredrag
    Siniscalchi, Sabato Marco; Svendsen, Torbjørn; Lee, Chin-Hui. (2007) Towards Bottom-Up Continuous Phone Recognition. 2007 IEEE Workshop on Automatic Speech Recognition and Understanding , Kyoto 2007-12-09 - 2007-12-13
  • Vitenskapelig foredrag
    Svendsen, Torbjørn. (2007) Articulatory Features and Segmental Information for Automatic Speech Recognition. ESF Exploratory Workshop on Models of Language Evolution, Acquisition and Processing , Leuven 2007-11-25 - 2008-11-28

2006

  • Poster
    Amdal, Ingunn; Svendsen, Torbjørn. (2006) FonDat1: A Speech Synthesis Corpus for Norwegian. LREC 2006 , Genova 2006-05-22 - 2006-05-28
  • Vitenskapelig foredrag
    Nordgård, Torbjørn; Svendsen, Torbjørn. (2006) Et norsk uttaleleksikon møter en spontan virkelighet. Oslomålet - et seminar med forskning fra NoTa-korpuset , Oslo 2006-11-23 - 2006-11-24
  • Vitenskapelig foredrag
    Amdal, Ingunn; Johnsen, Magne Hallstein; Svendsen, Torbjørn. (2006) Log Likelihood Ratio Based Annotation Verification of a Norwegian Speech Synthesis Database. NORSIG 2006 , Reykjavik 2006-06-07 - 2006-06-09
  • Vitenskapelig foredrag
    Svendsen, Torbjørn. (2006) Task and speaker adaptation. WISSAP'06 2006-01-04 - 2006-01-07

2005

  • Poster
    Skogstad, Trond; Svendsen, Torbjørn. (2005) Distributed ASR Using Speech Coder Data for Efficient Feature Vector Representation. Eurospeech 2005 , Lisboa 2005-09-04 - 2005-09-08
  • Poster
    Meen, Dyre; Svendsen, Torbjørn; Natvig, Jon-Emil. (2005) Improving Phone Label Aligment Accuracy by Utilizing Voicing Information. SPECOM 2005 , Patras 2005-10-17 - 2005-10-19
  • Vitenskapelig foredrag
    Svendsen, Torbjørn; Egeberg, Andreas; Holter, Trym. (2005) VOCALS - Voice centric user interfaces for location based services. NORSIG 05 , Stavanger 2005-09-22 - 2005-09-24
  • Vitenskapelig foredrag
    Svendsen, Torbjørn; Amdal, Ingunn; Bjørkan, Ingmund; Meen, Dyre; Heggtveit, Per Olav; Natvig, Jon Emil. (2005) FONEMA - Tools for realistic speech synthesis in Norwegian. NORSIG 05 , Stavanger 2005-09-22 - 2005-09-24
  • Poster
    Amdal, Ingunn; Svendsen, Torbjørn. (2005) Unit Selection Synthesis Database Development Using Utterance Verification. Interspeech 2005 , Lisboa 2005-09-04 - 2005-09-08
  • Poster
    Bjørkan, Ingmund; Svendsen, Torbjørn; Farner, Snorre. (2005) Comparing Spectral Distance Measures for Join Cost Optimization in Concatenative Speech Synthesis. Interspeech 2005 , Lisboa 2005-09-04 - 2005-09-08

2004

  • Vitenskapelig foredrag
    Svendsen, Torbjørn. (2004) Pronunciation Modeling for Speech Technology. 2004 International Conference on Signal Processing and Communications , Bangalore 2004-12-11 - 2004-12-14
  • Vitenskapelig foredrag
    Øien, Geir Egil; Holte, Nils; Andresen, Steinar; Svendsen, Torbjørn; Hammer, Mikael. (2004) Communication technology towards 2020. INFOSAM-2020 conference , Trondheim 2004-04-19 - 2004-04-20

2003

  • Poster
    Wong, Eddie; Martin, Terrence; Svendsen, Torbjørn; Sridharan, Sridha. (2003) Multilingual Phone Clustering for Recognition of Spontaneous Indonesian Speech Utilising Pronunciation Modelling Techniques. Eurospeech 2003 , Geneve 2003-09-04 -
  • Poster
    Martin, Terrence; Svendsen, Torbjørn; Sridharan, Sridha. (2003) Cross-Lingual Pronunciation Modelling for Indonesian Speech Recognition. Eurospeech 2003 , Geneve 2003-09-04 -
  • Faglig foredrag
    Svendsen, Torbjørn. (2003) Snakke dialekt med mobilen? Om dialektbruk i ny språkteknologi. , Oslo 2003-09-28 -
  • Faglig foredrag
    Svendsen, Torbjørn. (2003) FONEMA - Metodeutvikling for naturtro norsk talesyntese. KUNSTI-seminar 2003 , Bergen 2003-11-18 -
  • Faglig foredrag
    Svendsen, Torbjørn. (2003) Speech Processing Activities at NTNU: An Overview. Nordic Speech Technology Seminar , Stockholm 2003-11-14 -
  • Vitenskapelig foredrag
    Svendsen, Torbjørn. (2003) Pronunciation Modelling for Speech Technology. , Brisbane, Australia 2003-05-30 -

2002

  • Vitenskapelig foredrag
    Amdal, Ingunn; Svendsen, Torbjørn. (2002) Evaluation of pronunciation variants in the ASR lexicon for different speaking styles. Third International Conference on Language Resources and Evaluation , Las Palmas de Gran Canaria, Spain 2002-05-31 -

2001

  • Vitenskapelig foredrag
    Johnsen, Magne Hallstein; Harborg, Erik; Svendsen, Torbjørn; Amble, Tore; Holter, Trym; Myrvoll, Tor Andre. (2001) SPODIS - Spoken Dialog Systems for Telephony. NORSIG-2001, Norwegian Signal Processing Symposium , Trondheim, Norway, October 18-20 2001
  • Poster
    Myrvoll, Tor Andre; Paliwal, Kuldip K.; Svendsen, Torbjørn. (2001) Fast Adaptation using Constrained Affine Transformations with Hierarchical Priors. Eurospeech 2001 , Aalborg, Sept 3-7, 2001

2000

  • Faglig foredrag
    Svendsen, Torbjørn. (2000) Norsk språkbank, et nasjonalt korpus for språkteknologi. , Statssekretærutvalget for IT, Oslo, 12. januar, 2000
  • Faglig foredrag
    Svendsen, Torbjørn. (2000) Taleteknologi- teknologi med potensiale for kvalitetsheving og effektivisering ved håndtering av informasjon i sykehus. , Norges tekniske vitenskapsakademi, Trondheim, 22. februar, 2000
  • Faglig foredrag
    Svendsen, Torbjørn; Johnsen, Magne Hallstein. (2000) �Sesam sesam!� - Kan taleteknologi bli en døråpner for funksjonshemmede?. , Rehabiliteringskonferansen, Trondheim, 20. juni, 2000
  • Faglig foredrag
    Svendsen, Torbjørn. (2000) Ordets makt � om taleteknologi som hjelpemiddel for funksjonshemmede. , "Selvstendig liv", Sjølyst, 12. april, 2000
  • Vitenskapelig foredrag
    Johnsen, Magne Hallstein; Holter, Trym; Svendsen, Torbjørn; Harborg, Erik. (2000) Stochastic Modelling of Semantic Content for Use in a Spoken Dialogue System. 6th International Conference on Spoken Language Processing , Beijing, Oct. 16-20, 2000
  • Vitenskapelig foredrag
    Svendsen, Torbjørn. (2000) Pronunciation modeling for improved recognition of names. , AT&T Labs, Florham Park, New Jersey, 15. september 2000
  • Vitenskapelig foredrag
    Johnsen, Magne Hallstein; Svendsen, Torbjørn; Amble, Tore; Holter, Trym; Harborg, Erik. (2000) TABOR - A Norwegian Spoken Dialogue System for Bus Travel Information. 6th International Conference on Spoken Language Processing , Beijing, Oct. 16-20, 2000
  • Vitenskapelig foredrag
    Holter, Trym; Harborg, Erik; Johnsen, Magne Hallstein; Svendsen, Torbjørn. (2000) ASR-Based Subtitiling of Live TV-Programs for the Hearing Impaired. 6th International Conference on Spoken Language Processing , Beijing, Oct. 16-20, 2000

1999

  • Vitenskapelig foredrag
    Amdal, Ingunn; Holter, Trym; Svendsen, Torbjørn. (1999) Maximum likelihood pronunciation modelling of Norwegian natural numbers for automatic speech recognition. NORSIG'99 , Asker, september 1999
  • Vitenskapelig foredrag
    Amdal, Ingunn; Holter, Trym; Svendsen, Torbjørn. (1999) Modellering av uttalevariasjon for automatisk talegjenkjenning. Møte om norsk språk (MONS 8) , Tromsø, 18.-20. november 1999
  • Faglig foredrag
    Yang, Qian; Cremelie, Nick; Holter, Trym; Martens, Jean-Pierre; Svendsen, Torbjørn; Ringland, Simon. (1999) Lexicon building and word accuracy in continuous speech recognition. COST 249 meeting, Prague , Prague, Czech Republic, February 1999
  • Poster
    Harborg, Erik; Holter, Trym; Johnsen, Magne Hallstein; Svendsen, Torbjørn. (1999) Subtitling of live broadcast TV-programs for the hearing impaired. AAATE'99 , Dusseldorf, November 1999
  • Vitenskapelig foredrag
    Harborg, Erik; Holter, Trym; Johnsen, Magne Hallstein; Svendsen, Torbjørn. (1999) On-line captioning of TV-programs for the hearing impaired. EuroSpeech'99 , Budapest, Ungarn
  • Vitenskapelig foredrag
    Johnsen, Magne Hallstein; Svendsen, Torbjørn. (1999) Menneske/maskin-kommunikasjon basert på tale. MONS-8 (8nde Møte Om Norsk Språk) , Tromsø, Norway, Nov. 1999
  • Vitenskapelig foredrag
    Harborg, Erik; Holter, Trym; Johnsen, Magne Hallstein; Svendsen, Torbjørn. (1999) Generation of closed captions for live TV-programs using speech recognition. Norsig'99 , Asker, September 1999

1998

  • Vitenskapelig foredrag
    Svendsen, Torbjørn. (1998) SPODIS - Spoken dialog systems for telephony services. Studiemøtet i elektronikk og data , Kristiansand
  • Vitenskapelig foredrag
    Holter, Trym; Svendsen, Torbjørn. (1998) Maximum likelihood modelling of pronunciation variation. ESCA Tutorial and Research Workshop on Modeling Pronunciation Variation for ASR , Rolduc
  • Faglig foredrag
    Svendsen, Torbjørn. (1998) Speech processing activities at NTNU. , KTH, Stockholm
  • Faglig foredrag
    Svendsen, Torbjørn. (1998) Taleteknolog. Nordisk språkmøte , Trondheim
  • Faglig foredrag
    Svendsen, Torbjørn. (1998) Taleteknologi ved NTNU. Aalborg workshop in speech communication , Aalborg

1997

  • Faglig foredrag
    Svendsen, Torbjørn. (1997) Acoustic subwords - some applications in speech processing. , Griffith University, Brisbane, Australia
  • Faglig foredrag
    Svendsen, Torbjørn. (1997) Some topics from recent work in speech processing. , Motorola Research Labs, Sydney og University of Wollongong
  • Faglig foredrag
    Svendsen, Torbjørn. (1997) Speech recognition based on acoustic subword units. , Telenor FoU, Kjeller
  • Faglig foredrag
    Holter, Trym; Svendsen, Torbjørn. (1997) Combined optimisation of baseforms and model parameters in speech recognition based on acoustic sub-word units. , AT&T Labs, Florham Park, NJ, USA
  • Vitenskapelig foredrag
    Holter, Trym; Svendsen, Torbjørn. (1997) Incorporating linguistic knowledge and automatic baseform generation in acoustic subword unit based speech recognition. Eurospeech '97 , Rhodos
  • Vitenskapelig foredrag
    Holter, Trym; Svendsen, Torbjørn. (1997) Combined optimisation of baseforms and model parameters in speech recognition based on acoustic subword units. IEEE Speech recognition Workshop , Santa Barbara, Calif.
  • Vitenskapelig foredrag
    Holter, Trym; Svendsen, Torbjørn. (1997) A joint segmentation and labelling scheme for use in acoustic subword based speech recognition. Norwegian Signal Processing Symposium , Tromsø

1996

  • Vitenskapelig foredrag
    Pihl, Johnny; Johnsen, Magne Hallstein; Svendsen, Torbjørn. (1996) A VLSI implementation of pdf computations in HMM based speech recognition. TENCON-96 , Perth 1996-11-27 - 1996-11-29

1995

  • Vitenskapelig foredrag
    Johnsen, Magne Hallstein; Svendsen, Torbjørn; Harborg, Erik. (1995) Experiments on cepstral mean subtraction and Rasta-filtering applied to SAMPA phoneme recognition. COST249 , Nancy 1995-05-06 - 1995-05-07

1994

  • Faglig foredrag
    Svendsen, Torbjørn. (1994) Acoustic segmentation of speech : applications in speech processing. , [Mangler data]
  • Faglig foredrag
    Svendsen, Torbjørn. (1994) Acoustic segmentation of speech : applications in speech processing. , [Mangler data]
  • Vitenskapelig foredrag
    Svendsen, Torbjørn. (1994) Segmental quantization of speech spectral information. IEEE International Conference on Acoustics, Speech and Signal Processing , [Mangler data]

1993

  • Vitenskapelig foredrag
    Svendsen, Torbjørn. (1993) Efficient quantization of speech spectral information. EUROSPEECH '93 (1993 : Berlin) , [Mangler data]

1989

  • Vitenskapelig foredrag
    Svendsen, Torbjørn Karl; Paliwal, Kuldip K.; Harborg, Erik; Husøy, Per Ove. (1989) An Improved Sub-Word Based Speech Recognizer. International Conference on Acoustics, Speech, and Signal Processing (ICASSP) , Glasgow 1989-05-01 -

1988

  • Vitenskapelig foredrag
    Svendsen, Torbjørn Karl; Paliwal, K.K.; Harborg, Erik; Husøy, P.O.. (1988) Experiments with a Sub-Word Based Speech Recognizer. International Conference on Speech Science and Technology (ICSST) , Sydney 1988-12-01 -

NTNU – Norges teknisk-naturvitenskapelige universitet

  • For ansatte
  • |
  • For studenter
  • |
  • Innsida
  • |
  • Blackboard

Studere

  • Om studier
  • Studieprogram
  • Emner
  • Videreutdanning
  • Karriere

Aktuelt

  • Nyheter
  • Arrangement
  • Jobbe ved NTNU

Om NTNU

  • Om NTNU
  • Bibliotek
  • Strategi
  • Forskning
  • Satsingsområder
  • Innovasjon
  • Organisasjonskart
  • Utdanningskvalitet

Kontakt

  • Kontakt oss
  • Finn ansatte
  • Spør en ekspert
  • Pressekontakter
  • Kart

NTNU i tre byer

  • NTNU i Gjøvik
  • NTNU i Trondheim
  • NTNU i Ålesund

Om nettstedet

  • Bruk av informasjonskapsler
  • Tilgjengelighetserklæring
  • Personvern
  • Ansvarlig redaktør
Facebook Instagram Linkedin Snapchat Tiktok Youtube
Logg inn
NTNU logo