刘挺简历
基本情况
男,1972年2月出生于哈尔滨,哈尔滨工业大学教授、博导
在学校担任的管理职务
·
2000.10至今, 哈工大计算机研究所副所长
·
2001.3至今,哈工大信息检索研究室主任
·
2004.11至今, 语言语音教育部微软重点实验室(哈尔滨工业大学)副主任
·
2009.3至今,哈工大计算机学院院长助理,主抓学科建设
社会兼职
国家863计划重点项目“中文为核心的多语言处理技术”总体组专家
中国中文信息学会
o
理事
o
信息检索专业委员会,副主任
o
计算语言学专业委员会,委员
中国计算机学会
o
高级会员
o
中文信息技术专业委员会,委员
o
YOCSEF,学术委员会委员
联系方式:
实验室邮箱:tliu@ir.hit.edu.cn;
其他常用邮箱:tliu72@gmail.com
主页: http://ir.hit.edu.cn/~tliu/;
博客:http://blog.sina.com.cn/tliu7221
邮寄地址:
哈尔滨工业大学321信箱,哈尔滨
电话: +86-451-86413683(86402993)-801,
13936137628
传真: +86-451-86413683(86402993)-812
办公地址:
哈尔滨市南岗区教化街27号6楼
荣誉
研究领域
教学经历
1995 - 1998: “人工智能”, 面向哈工大计算机专业研究生
2001 - 2004: “统计自然语言处理”, 面向哈工大计算机专业研究生
2001 - 2009: “信息检索”, 面向哈工大计算机专业研究生
2006 – 2009: 计算机新进展,面向哈工大计算机专业本科生
职业经历
2004.7 至今: 教授, 哈工大计算机学院
2000.10 - 2004.7: 副教授,哈工大计算机学院
2000.5 - 2000.10: 讲师,哈工大计算机学院
1999.4 - 2000.5: 副研究员,微软中国研究院,自然语言计算组
1998.7 - 1999.4: 讲师,哈工大计算机系
1995.6 - 1998.7: 助教,哈工大计算机系
1995.9 - 1998.7: 博士生,哈工大计算机系
1993.9 - 1995.7: 硕士生,哈工大计算机系
1989.9 - 1993.7: 本科生,哈工大计算机系
主持或参与的科研项目
国家项目:
2008.1-2011.12: 下一代信息检索研究,国家自然科学基金重点项目
2008.1-2010.12: 基于实体关系的文本内容挖掘与集成技术平台,国家863计划探索类课题
2009.1 - 2011.12: 中文依存分析, 国家自然科学基金青年基金
2007.1 - 2009.12: 中文语义角色标注, 国家自然科学基金面上项目
2007.1 - 2008.12: 基于XML的分层互动中文处理开放平台,国家863计划探索类课题
2006.1 - 2008.12: 基于等价伪词的中文词义消歧,国家自然科学基金面上项目
2006.1 - 2008.12: 中文短语及简单句复述技术,国家自然科学基金面上项目
2005.1 - 2008.12: 问题理解与答案抽取,国家自然科学基金重点项目“问答式信息检索”的子课题
2003.1 - 2004.12: 开放域问答式信息检索技术研究, 国家自然科学基金面上项目
2003.2 - 2003.7: 中文信息模糊匹配技术,国家863课题
2001.1 - 2002.12: 基于依存分析的中文自动校对,国家863课题“中文处理平台”的子课题
信息产业部项目:
2007.1 - 2007.12: 短信息理解 242项目
2006.1 - 2006.12: 群发信息检测与过滤 242项目
2005.1 - 2005.12: 群发信息处理
2004.11 – 2005.5: 敏感信息聚类分析与特征抽取
2002.10 - 2003.12: 数据去冗余系统
2002.10 - 2003.12: 群发邮件自动发现与分析系统
2001.12 - 2002.12: 因特网主机攻击报警平台
2001.5 - 2002.12: 大规模网页快速去重系统
2000.10 - 2001.5: 网上有害信息人机互助式过滤系统
国际合作项目:
2008-2009:
特定域个性化交互式问答技术
2007
– 2008: 中文依存句法分析
2007: 中文共指消解
2006: 机构信息抽取
2005-2006: 中文词义消歧
2006: 中文依存句法分析
2005: 英文复述技术
2005: 多文档文摘
2003: 双语例句获取与处理
企业合作项目
2008, 语言技术平台授权
2007 - 2008, 中英双语例句检索
2006, 中文文本分类、聚类和文摘
2005 - 2006, 简繁转换等七项中文处理技术
2005, 在线客服系统
注:以上没有注明负责人的项目,负责人均为刘挺本人
科研团队中的助手
秦兵, 2000.5至今, 教授、博士生导师
张宇, 2002.4至今, 副教授、博士
车万翔, 2000.5至今, 讲师、博士
指导的博士生
作为副导师指导的博士生(导师均为
卢志茂, 2003.9 – 2006.7 ,词义消歧
李维刚, 2002.9
- 2008.1 ,复述技术
马金山, 2003.3
- 2008.1 ,依存句法分析
车万翔, 2004.3-2008.12,语义角色标注
洪宇, 2004.9入学,话题检测与跟踪
张志昌, 2005.3入学,阅读理解
陈毅恒, 2005.3 入学,文本聚类
贺瑞芳, 2005.9 入学,自动文摘
赵世奇, 2006.3入学,复述技术
宋巍, 2008.9入学,个性化信息检索
郭宇航, 2008.9入学,词义消歧
作为导师指导的博士生:
赵妍妍, 2007.9入学,意见挖掘
伍大勇, 2007.9入学,问答系统
和为, 2008.3入学,复述技术
李正华, 2008.9入学,依存分析
戈马(埃塞俄比亚),2008.9入学,个性化信息检索
薛涵,2009.3入学,文本挖掘
学术活动
编委
1.
中文信息学报
审稿人
1. Natural Language
Engineering
2. 计算机学报
3. 自动化学报
4. 电子学报
5. 软件学报
发表论文
博士论文
基于篇章多级依存结构的自动文摘研究
导师:洪家荣、王开铸,哈工大计算机系, 1998.7
英文论文
2008年
1.
Wanxiang Che, Min Zhang, Ai Ti Aw, Chew Lim Tan, Ting
Liu, and Sheng Li. Using a Hybrid Convolution Tree
Kernel for Semantic Role Labeling. ACM Transactions on Asian Language
Information Processing. To appear. (EI Indexed)
2.
Min Zhang, Wanxiang Che, Guodong
Zhou, Ai Ti Aw, Chew Lim Tan, Ting Liu,and
Sheng Li. Semantic Role Labeling Using a
Grammar-Driven Convolution Tree Kernel. IEEE Transactions on Audio, Speech, and
Language Processing. 2008, 16(7):1315-1329 (SCI Impact Factor: 0.8)
3.
Wei Zheng, Yu Zhang, Yu Hong, Jili
Fan, Ting Liu,“Topic Tracking Based on Keywords
Dependency Profile” AIRS
pp129-140,2008.01
4.
Wanxiang
Che, Min Zhang, Ai Ti Aw, Chew Lim Tan, Ting Liu, Sheng
Li ,“Fast Computing Grammar-driven Convolution Tree Kernel for Semantic Role
Labeling” IJCNLP’08
5.
Shiqi Zhao, HaifengWang, Ting Liu, Sheng
Li “Pivot Approach for Extracting
Paraphrase Patterns from Bilingual Corpora” Proceedings of ACL pp780–788,2008
6.
Shiqi Zhao, Cheng Niu, Ming Zhou, Ting Liu, Sheng
Li “Combining Multiple Resources to
Improve SMT-based Paraphrasing Model” Proceedings of ACL pp1021-1029,2008
7.
Xiaofeng Yang, Jian Su, Jun Lang, ChewLim Tan,
Ting Liu, Sheng Li “An Entity-Mention Model for Coreference Resolution with Inductive Logic Programming”
Proceedings of ACL pp843-851,2008
2007年
8.
Shiqi Zhao, Lin Zhao, Yu Zhang, Ting Liu, Sheng Li
“HIT Web based Scoring Method for English Lexical Substitution “ Proceedings of
SemEval pp:173-176 2007.06
9.
Min Zhang,Wanxiang Che,Aiti Aw and
Chew Lim Tan,Ting Liu,Sheng
Li “A Grammar-driven Convolution Tree Kernel for Semantic Role Classification “
Proceedings of the 45th Annual Meeting of the Association of Computational
Linguistics pages200-207, Prague,
Czech Tepublic,June 2007.
10.
Yuhang Guo, Wanxiang Che, Yuxuan Hu,
Wei Zhang and Ting Liu “HIT-IR-WSD: A WSD System for English Lexical Sample
Task “International Workshop on Semantic Evaluations Association for
Computational Linguistics, Prague, Czech Republic 2007, pp. 165--168.
11.
12.
Shiqi Zhao, Ming Zhou, Ting Liu “Learning Question Paraphrases for QA from
Encarta Logs “ Proceedings of IJCAI
pp:1795-1800,2007.01
13.
Shiqi Zhao, Ting Liu, Xincheng Yuan, Sheng Li, and Yu Zhang “Automatic Acquisition of
Context-Specific Lexical Paraphrases “ Proceedings of IJCAI pp:1789-1794 2007.01
14.
Jun
Lang, Bing Qin, Ting Liu, Sheng Li “Intra-document Coreference Resolution: The state of the art “ Journal of
Chinese Language and Computing
pp227-253, Vol.17(4) 2007
2006年
15.
Liqi Gao, Yu Zhang, Ting Liu, Guiping
Liu “Word Sense Language Model for Information Retrieval “ In Proceedings of AIRS(Asia Information
Retrieval Symposium 2006.10,pages
158-171
16.
Shiqi Zhao, Ting Liu, Xincheng Yuan, Sheng Li, Yu Zhang
“Web Mining for Lexical Context-Specific Paraphrasing “ In Proceedings
of AIRS(Asia Information Retrieval Symposium) 2006.10,pages 673-679
17.
Ting
Liu, Jinshan Ma, Sheng
Li “Building a Dependency Treebank
for Improving Chinese Parser “ Journal of Chinese Language and Computing.
2006.10,16(4):207-224
18.
Zhimao Lu, Haifeng Wang, Jianmin
Yao, Ting Liu, Sheng Li “An Equivalent Pseudoword
Solution to Chinese Word Sense Disambiguation” In Proceedings of the 44th Annual
Meeting of the Association for Computational Linguistics (ACL-2006.03),pages 457-464
19.
Wanxiang Che, Min Zhang, Ting Liu, Sheng Li “A
Hybrid Convolution Tree Kernel for Semantic Role Labeling” In Proceedings of the 44th Annual
Meeting of the Association for Computational Linguistics pp73-80,(ACL-2006.03)
20.
Ting
Liu, Jinshan Ma, Huijia
Zhu, Sheng Li
“Dependency Parsing Based on Dynamic Local Optimization” In Proceedings of CoNLL pp211-2152,2006.02
2005年
21.
Weigang Li, Ting Liu, Yu Zhang, Sheng
Li and Wei He “Automated
Generalization of Phrasal Paraphrases from the Web “ The 3rd International Workshop on
Paraphrasing (IWP2005.10), pp49-57
22.
Wanxiang Che, Jianmin
Jiang, Zhong Su, Yue Pan
and Ting Liu “Improved-Edit-Distance
Kernel for Chinese Relation Extraction “
The Second International Joint Conference on Natural Language Processing
(IJCNLP-05), 2005.10, Jeju Korea , pp134-139
23.
Zhuoran Wang,Ting Liu “Chinese
Unknown Word Identification Based on Local Bigram Model “ International Journal of Computer
Processing of Oriental Languages .
2005,.09,18(3): 185-196
24.
Huipeng Zhang, Ting Liu, Jinshan Ma
and Xiantao Liao
“Chinese Word Segmentation with Multiple Postprocessors in HIT-IR Lab
“ SIGHAN 2005.08, pp172-175
25.
Ting
Liu, Wanxiang Che, Sheng Li, Yuxuan Hu, and Huaijun Liu “Semantic role labeling system using
maximum entropy classifier “ In
Proceedings of CoNLL 2005.06,Ann Arbor, Michigan, pp189-192
26.
Lu Zhimao,
2004年
27.
Weigang Li,Ting Liu,Sheng Li “
Combining Sentence Length with Location Information to Align Monolingual
Parallel Texts “ Asia Information
Retrieval Symposium 2004, pages
71-77 (Lecture Notes in Computer Science, Volume 3411/2005, Pages118-128)
28.
Zhuoran Wang,Ting Liu “hinese Unknown Word Identification Based on Local Bi-gram
Model with Integrally Smoothing Assumption“International
Conference on Chinese Language Computing pp524-528,2004.9
29.
Zhimao Lu,Ting Liu,Sheng Li “Combining Neural
Networks and Statistics for Chinese Word Sense Disambiguation” Third SIGHAN Workshop on Chinese
Language Processing pp49-56,2004.7
30.
Weigang Li,Ting Liu,Zheng Wang,Sheng Li
“Aligning Bilingual Corpora Using Sentences Location Information” Third
SIGHAN Workshop on Chinese Language Processing pp141-147,2004.7
31.
Wanxiang Che,Ting Liu,Sheng Li “A New Chinese Natural
Language Understanding Architecture Based on Multilayer Search Mechanism” Third SIGHAN Workshop on Chinese
Language Processing
pp134-140,2004.07
32.
Jinshan Ma,Yu Zhang,Ting Liu,Sheng Li “A
Statistical Dependency Parser of Chinese under Small Training Data” The 1st International Joint Conference
of Natural Language Processing
pp1-4 2004,3
中文论文
2008年
33.
洪宇、郑伟 、张宇、邹博伟、刘挺 ,“基于子话题分治匹配的新事件检测” 计算机学报 Vol. 31,
No. 4, pp. 687-695, 2008
2007年
34.
洪宇、张宇、刘挺、李生 ,“话题检测与跟踪的评测及研究综述” 中文信息学报
Vol. 21, No. 6, pp. 71-87, 2007
35.
洪宇,张宇,刘挺,郑伟,龚诚,李生 “基于层次聚类的自适应信息过滤学习算法”中文信息学报
Vol. 21, No. 3, pp. 47-53, 2007
36.
37.
李维刚、刘挺、李生 “基于双语语料库的短语复述实例获取研究“ 中文信息学报
pp:362-367 ,2007.08 第5期
38.
刘 挺,车万翔,李生 “基于最大熵分类器的语义角色标注“软件学报
Vol.18,No.3,3. 2007,pp.565-573
39.
李维刚、刘 挺、李 生 “基于网络挖掘的实体关系元组自动获取” 电子学报 pp2111-2116,2007,35(11)
40.
黄永光,刘挺,车万翔,胡晓光 “面向变异短文本的快速聚类算法” 中文信息学报 2007.21卷,02期, pp:63-68
2006年
41.
刘挺,马金山,李生 “基于词汇支配度的汉语依存分析模型“软件学报
2006.06,17(9):1876-1883
42.
秦兵, 刘挺, 陈尚林,李生 “多文档文摘中句子优化选择方法研究“
计算机研究与发展
第43卷,第6期,pp1129-1134,2006年6月
43.
卢志茂,刘挺,李生 “基于无指导机器学习的全文词义自动标注方法“
自动化学报 2006,3, pages 228-236
44.
刘挺,李维刚,张宇,李生
“复述技术研究综述”
中文信息学报
2006.03,40(4),pp25-33
45.
文勖,张宇,刘挺,马金山 “基于句法结构分析的中文问题分类” 中文信息学报
2006.03,20(2),pp33-39
46.
卢志茂,刘挺,李生 “统计词义消歧的研究进展” 电子学报 2006, 2,
pages 333-343
2005年
47.
赵世奇, 张宇, 刘挺, 陈毅恒, 黄永光, 李生
“基于类别特征域的文本分类特征选择方法“ 中文信息学报 2005.12,
19(6): 21-27
48.
秦兵, 刘挺, 李生 “多文档自动文摘综述“
中文信息学报
2005.11, 19(6): 13-20
49.
陈儒, 张宇, 刘挺 “面向中文特定信息变异的过滤技术研究“
高技术通讯
2005.09, 15(9): 7-12
50.
张宇, 刘挺, 文勖
“基于改进贝叶斯模型的问题分类“ 中文信息学报 2005.02, 19(2):100-105
51.
张宇, 刘挺, 陈毅恒, 赵世奇, 李生 “自然语言文本水印技术“
中文信息学报
2005.02, 19(6): 13-20
52.
车万翔, 刘挺, 李生 “实体关系自动抽取“
中文信息学报
2005.02, 19(2):1-6
2004年
53.
卢志茂,刘挺,
54.
车万翔,刘挺,秦兵,李生
“基于改进编辑距离的中文相似句子检索”
高技术通讯
2004.07,pp15-20
55.
马金山,张宇,刘挺,李生
“利用三元模型及依存分析查找中文文本错误”
情报学报
2004.06Page:723-728
56.
秦兵,刘挺,李生
“基于局部主题判定与抽取的多文档文摘技术”
自动化学报 2004,5,pp905-910
57.
赵永贞,刘挺,王志伟,陈惠鹏,邵艳秋
“汉语文语转换系统中停顿指数的自动标注”
中文信息学报2004.05,pp48-53
专利
1.
Computer-Aided Writing System and Method with
Cross-language Writing Wizard, (1st inventor ), US Patent# 7107204, Sept. 12,
2006
技术评测
国际技术评测
1.
CoNLL’2009, 多国语语义角色标注与依存分析国际评测,第1名,20家单位参加
2.
CoNLL’2008, 语义角色标注与依存分析国际评测,第2名(在国内参赛单位第1),20家单位参加
3.
美国NIST机器翻译评测, 2008, 英汉翻译第5名(国内第1),9家单位参加
4.
CoNLL‘2006, 语义角色标注,第6名,19家单位参加
5.
SIGHAN’2005, 中文分词,北大测试集,第3名
国家863组织的技术评测
6.
2003, 自动文摘评测第1名
7.
2004, 信息检索评测第2名
8.
2005, 信息检索评测第1名
技术产品化
1.
中英双语例句检索系统成为金山爱词霸短句搜索服务,金山爱词霸是中国最大的在线英语词典和学习社区
2.
中文处理系列技术,包括分词、英文拼写检查、简繁/繁简转换、拼音标注、自动文摘、英文断词、中文同义词扩展等,嵌入金山WPS Office办公软件中,金山WPS是有20多年历史的国产中文办公软件
3.
语言技术平台(LTP)是一个集成化的中文分析软件系统,它包括6项基础的中文处理技术,如分词、词性标注、命名实体识别、词义消歧、依存句法分析、语义角色标注等,以及2项中文语料库和词典。目前,该平台已经被270多家国内外研究机构免费共享,各家单位基于LTP发表的论文超过50篇。
开发的演示系统
1.
语言技术平台: http://ir.hit.edu.cn/demo/ltp/
2.
爱词霸双语例句检索: http://dj.iciba.com/