近期演講記錄
2011
- (20110105)交大資工系:音訊辨識技術與應用 - 以遊戲為導向的語音與音樂學習
摘要:本演講將說明各項音訊辨識技術在語音與音樂學習方面的應用,這些技術包含語音識別(speech recognition)、文字轉語音(text-to-speech conversion)、語音評分(speech assessment)、哼唱選歌(query by singing/humming)、音高追蹤(pitch tracking)、節拍追蹤(beat tracking)、歌聲分離(singing voice separation)等。由於每個技術項目都有各自的特性,因此我們在應用於以遊戲為導向的學習時,必須考慮到這些特性,才能建構出有趣的應用程式。本演講將穿插各項展示,讓聽眾能夠體驗每項技術的優點和缺點,並說明如何以流程和創意來發揮最大的學習效果。
2010
- (20101227)資策會:音訊辨識技術與應用 - 以遊戲為導向的語音與音樂學習
摘要:本演講將說明各項音訊辨識技術在語音與音樂學習方面的應用,這些技術包含語音識別(speech recognition)、文字轉語音(text-to-speech conversion)、語音評分(speech assessment)、哼唱選歌(query by singing/humming)、音高追蹤(pitch tracking)、節拍追蹤(beat tracking)、歌聲分離(singing voice separation)等。由於每個技術項目都有各自的特性,因此我們在應用於以遊戲為導向的學習時,必須考慮到這些特性,才能建構出有趣的應用程式。本演講將穿插各項展示,讓聽眾能夠體驗每項技術的優點和缺點,並說明如何以流程和創意來發揮最大的學習效果。
- (20101026)MATLAB Technical Forum: Speech and Audio Processing with MATLAB
Abstract: In this talk, I will briefly review several machine learning techniques for data clustering and pattern recognition. In particular, I will cover K-means clustering, hierarchical clustering, KNNC (k-nearest neighbor classifier), quadratic classifier, and GMM (Gaussian mixture model) classifier. We shall focus on how to implement such tasks, and how to effectively visualize the clustering/classification results with MATLAB.
2009
- (20091020)MATLAB Technical Forum: Machine Learning for Data Clustering and Pattern Recognition
Abstract: Speech and Audio have been an important part of multimedia processing. In this talk, we shall cover important aspects of speech/audio processing and recognition using MATLAB. In particular, we shall address the applications of speech/speaker recognition, speech assessment, and query by singing/humming, and highlight how MATLAB/Simulink can be used effectively for data analysis/visualization for such applications.
2008
- (20080613)資策會:數位學習領域之語音技術應用分享(語音辨識,電腦輔助練習,互動式電子寵物)
- (20080714)北京大學計算語言所:語音技術在口說華語學習的應用
摘要:本演講將說明各項語音技術在華語學習方面的應用,這些語音技術包含語音識別(speech
recognition)、文字轉語音(text-to-speech conversion)、語音評分(speech
assessment)、聲調辨識(tone recognition)、韻律轉換(prosody conversion)等,由於每個技術項目都有各自的特性,因此我們在應用於口說華語學習時,必須考慮到這些特性,才能相輔相成。本演講將穿插各項演示,讓各位老師同學能夠體驗每項技術的優點和缺點,並說明如何以流程和創意來發揮最大的學習效果。
- (20080715)北京微軟亞洲研究院:Progressive Filtering and Its Application for Query-by-Singing/Humming
Abstract: This talk presents the mathematical formulation and design methodology of progressive filtering (PF) for multimedia information retrieval, and reports its application on the so-called query by singing/humming (QBSH), or more formally, melody recognition. The concept of the proposed PF and the corresponding efficient design method based on dynamic programming are applicable to large multimedia retrieval systems for striking a balance between efficiency (in terms of response time) and effectiveness (in terms of recognition rate). The application of the proposed PF to a 5-stage QBSH system is reported, and the experimental results demonstrate the feasibility of the proposed approach.
- (20080729)北京微軟亞洲研究院:Research Activities at MIR Lab
- (20080731)北京三星研究院:哼唱選歌與語音評測
- (20081121)資策會:語音技術在口說華語學習的應用
內容摘要:本演講將說明各項語音技術在華語學習方面的應用,這些語音技術包含語音辨識(speech recognition)、文字轉語音(text-to-speech conversion)、語音評分
(speech assessment)、聲調辨識(tone recognition)、韻律轉換(prosody
conversion)等,由於每個技術項目都有各自的特性,因此我們在應用於口說華語學習時,必須考慮到這些特性,才能相輔相成。本演講將穿插各項展示以便說明每項技術的優點和缺點,並說明如何以流程和創意來發揮最大的學習效果。
2005
- (20051105)台中一中:音訊技術在娛樂、教育與家電的應用
摘要:
隨著電腦運算速度的突飛猛進,許多需要大量資料處理與運算的音訊技術,漸漸滲入各個領域,原先高不可攀的理論,變成隨處可見的應用。本演講將介紹基本的音訊處理,並說明這些技術在娛樂、教育與家電的應用,演講中會穿插各種展示,以讓同學們瞭解音訊技術的實際應用面,包含:
- 互動式電腦/手機卡拉OK:多模式音樂檢索、歌聲即時評分
- 電腦輔助口說英語/漢語學習:語音辨識、音高追蹤
- 背書機:語音辨識與合成
- 科南機:語音轉換與變調
- 大頭狗與頑皮豹:語音辨識、旋律辨識
2004
- (20041210)電機工程學會年會:多模式音樂檢索在數位生活的應用(隨著電腦速度的加快與多媒體處力能力的提高,在電腦上進行卡拉OK歡唱已經不是遙不可及的夢想,尤其再加上各種音訊處理與辨識技術,以及社群與互動模式的建立,卡拉OK會漸漸變成一項互動式的線上遊戲產業,扮演個人電腦與數位家庭在娛樂面的重要角色。本演講將說明如何應用多模式音樂檢索於電腦卡拉OK,以及此種應用模式對於數位生活所帶來的衝擊與影響。(在演講中會穿插系統展示,包含卡拉OK軟體與智慧型互動玩具。)
本演講的大綱如下:
- 互動式電腦卡拉OK的簡介
- 技術面:語音辨識、旋律辨識、歌聲即時評分、哼唱譜和弦
- 應用面:玩具、手機、PC、線上遊戲
- 系統展示與未來展望
- (20041030-31)2004清華「知識嘉年華」:互動式電腦卡拉OK:你今天唱了嗎?(隨著電腦速度的加快與多媒體處力能力的提高,在電腦上進行卡拉OK歡唱已經不是遙不可及的夢想,尤其再加上各種音訊處理與辨識技術,以及社群與互動模式的建立,卡拉OK會漸漸變成一項互動式的線上遊戲產業,扮演個人電腦與數位家庭在娛樂面的重要角色。)
- (20040517)台灣科技大學資訊工程系:多模式音樂檢索
- (20040317)交通大學電信工程系:多模式音樂檢索
2003
- (20031113)健康管理學院資訊傳播系:多模式音樂檢索
- (20030527)長庚大學電機工程系:多模式音樂檢索
- (20030521)師範大學資訊工程系:多模式音樂檢索
- (20030324)台灣科技大學電機工程系:多模式音樂檢索
- (20030318)The 4th Sino Franco Workshop on Web Technologies at 淡江大學:An Internet Music Search Enginewith Multi-modal User Interface
2002
- (20020509)交通大學資訊工程系:多模式音樂檢索(本演講將介紹多模式音樂檢索的概念、研究與實作,以及其他與音樂及音訊的相關研究,如歌聲合成、歌聲評分、自動配和弦、語音辨識等。在演講中會穿插系統展示,以使同學瞭解相關技術的實用性。)
- (20020315)清華大學電機工程系:多模式音樂檢索及語音辨識(本演講將介紹多模式音樂檢索的概念、研究與實作,以及其他與音樂及音訊的相關研究,如語音辨識、歌聲合成與評分等。在演講中會穿插系統展示,以使同學瞭解相關技術的實用性。)
2001
- (20011219)中央大學資訊工程系:多模式音樂檢索、歌聲合成與評分(本演講將介紹多模式音樂檢索的概念、研究與實作,以及其他與音樂的相關研究,如歌聲合成與評分等。本演講亦會說明在將研究成果轉化成商品的過程中,所遇到的各種困難以及可能的解決方案。)
- (20011123)成功大學資訊工程系:音樂檢索、歌聲合成與評分
- (20010926)清華大學資訊系碩士班書報討論:音樂檢索與歌聲評分
- (20010804)清華大學科管所 EMBA 專修班:音樂檢索與歌聲合成 - 技術簡介與商業化考量
- (20010713)人工智慧論壇(人工智慧學會主辦)專題演講:音樂資訊檢索
- (20010705)清華大學科學研習營:歌聲辨識、合成與評分
- (20010413)元智大學電機系:「哼唱選歌」系統的研究與實作
- (20010301)交通大學資工系:找歌?用唱的!
2000
- 2000 MATLAB Conference at Taipei: Audio/Melody Recognition Using MATLAB/Simulink
- (20001214)中央研究院資訊所:「以歌選歌」系統的研究與實作(Research/Development of a Content-Based Music Retrieval System)
- 中山科學院:Scientific Visualization with MATLAB
- 交通大學資科系
- 清華大學資訊系碩士班書報討論:Content-based Music Retrieval System (「以歌選歌」系統)
1999
- 1999 MATLAB Conference at Singapore: Content-based Music Retrieval and Speaker Recognition
- 1999 MATLAB Conference at Taipei: Query by Singing
- 清華大學資訊系碩士班書報討論:Pattern Recognition