密集科研項(xiàng)目:人工智能與數(shù)據(jù)科學(xué)專題:機(jī)器學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)及其在推薦系統(tǒng)中的應(yīng)用【大學(xué)組】
2022-12-19 14:47:01 來源:中國教育在線
導(dǎo)師學(xué)校介紹
布朗大學(xué)(Brown University)創(chuàng)立于1764年,是全美第七古老的大學(xué),坐落在美國羅得島州首府普羅維登斯市,是一所享譽(yù)世界的頂級私立研究型大學(xué),聞名世界的八所常春藤聯(lián)盟成員,北美頂尖大學(xué)學(xué)術(shù)聯(lián)盟美國大學(xué)協(xié)會成員。布朗大學(xué)在2020年U.S.News美國大學(xué)綜排Top14。
導(dǎo)師詳細(xì)介紹
導(dǎo)師昵稱
Sorin
導(dǎo)師級別
講席終身正教授
導(dǎo)師學(xué)校
布朗大學(xué)Brown University
Sorin導(dǎo)師是布朗大學(xué)計(jì)算和數(shù)學(xué)科學(xué)和計(jì)算機(jī)科學(xué)終身正教授,曾任布朗大學(xué)計(jì)算分子生物學(xué)中心主任。在加入布朗之前,他是Celera Genomics的高級主管和信息學(xué)研究負(fù)責(zé)人,他們共同撰寫了2001年的科學(xué)論文“人類基因組的序列”,該論文迄今為止被引用超過12,000次,是最重要的論文之一。引用的科學(xué)論文。2003年,他加入了應(yīng)用系統(tǒng)科學(xué)研究員的行列,這是一家擁有800名科學(xué)家的公司中僅有的六名科學(xué)研究員之一。2000年,他獲得了統(tǒng)計(jì)力學(xué)中一個(gè)50年前未解決的問題,三維Ising模型問題的否定解(計(jì)算難點(diǎn))。該工作被列入美國能源部前25年最重要的100項(xiàng)發(fā)現(xiàn),并作為美國能源部在高級科學(xué)計(jì)算方面的第7項(xiàng)頂級成就。Sorin教授的研究重點(diǎn)是算法和計(jì)算復(fù)雜性以及統(tǒng)計(jì)物理學(xué)。他是計(jì)算生物學(xué)雜志的主編,他是RECOMB會議系列的聯(lián)合創(chuàng)始人,麻省理工學(xué)院出版社計(jì)算分子生物學(xué)系列的聯(lián)合編輯和Springer-Verlag講座筆記的聯(lián)合編輯在生物信息學(xué)系列。
Prof.Sorin is the Julie Nguyen Brown Professor of Computational and Mathematical Sciences and Professor of Computer Science,and former Director of the Center for Computational Molecular Biology at Brown University.Before joining Brown,he was the Senior Director and then Head of Informatics Research at Celera Genomics,they co-authored the 2001 Science paper“The Sequence of the Human Genome,”which,with over 12,000 citations to date,is one of the most cited scientific paper.In 2003 he joined the ranks of Applied Biosystems Science Fellows,one of just six Science Fellows in a company of 800 scientists.In 2000,he obtained the negative solution(computational intractability)of a 50 years old unresolved problem in statistical mechanics,the Three-Dimensional Ising Model Problem.This work was included in the Top 100 Most Important Discoveries of the U.S.Department of Energy’s first 25 years,and as the 7th top achievement of DOE in Advanced Scientific Computing.Professor Istrail's research focuses on computational molecular biology,human genetics and genome-wide associations studies,medical bioinformatics of autism,multiple sclerosis,HIV,preterm labor and viral immunology,algorithms and computational complexity,and statistical physics.He is Editor-in-Chief of the Journal of Computational Biology and he is co-founder with of the RECOMB Conference series,and co-Editor of the MIT Press Computational Molecular Biology series and of co-Editor of the Springer-Verlag Lecture Notes in Bioinformatics series.
適合人群
方向:理工
專業(yè):人工智能
適合專業(yè):計(jì)算機(jī)科學(xué),機(jī)器學(xué)習(xí),通信工程,數(shù)據(jù)工程,編程語言,推薦系統(tǒng)
項(xiàng)目價(jià)格:33800/19800
項(xiàng)目周期:4周在線小組科研學(xué)習(xí)+2周論文指導(dǎo)
是否建議高中生學(xué)習(xí):否
是否建議大學(xué)生學(xué)習(xí):是
語言:英文
難度:高級難度
建議具備的基礎(chǔ):數(shù)據(jù)科學(xué)、人工智能、統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等專業(yè)的學(xué)生;學(xué)生需要具備線性代數(shù)及概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ),修讀過算法與數(shù)據(jù)結(jié)構(gòu)并能熟練使用如隨機(jī)森林等經(jīng)典機(jī)器學(xué)習(xí)算法
科研項(xiàng)目產(chǎn)出
4周在線小組科研學(xué)習(xí)+2周論文指導(dǎo)學(xué)習(xí)共125課時(shí)+不限時(shí)論文指導(dǎo)
學(xué)術(shù)報(bào)告
優(yōu)秀學(xué)員獲主導(dǎo)師Reference Letter
EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等級別索引國際會議全文投遞與發(fā)表指導(dǎo)(可用于申請)
結(jié)業(yè)證書
成績單
項(xiàng)目介紹
項(xiàng)目中,導(dǎo)師將介紹用于知識發(fā)現(xiàn)的大數(shù)據(jù)挖掘的基礎(chǔ)編程模型和算法。學(xué)生對其代碼實(shí)現(xiàn)后,將使用真實(shí)生活中的數(shù)據(jù)集(如Yelp評論、亞馬遜交易和MovieLens數(shù)據(jù)等)進(jìn)行模型訓(xùn)練,并檢測出有意義的用戶偏好及習(xí)慣。在項(xiàng)目中后期,學(xué)生將結(jié)合所學(xué)知識及導(dǎo)師建議對基礎(chǔ)推薦算法及模型進(jìn)一步優(yōu)化研究,構(gòu)建一個(gè)新穎、準(zhǔn)確且高效的個(gè)性化推薦系統(tǒng),并在項(xiàng)目結(jié)束時(shí)提交項(xiàng)目報(bào)告、進(jìn)行成果展示。This program will introduce the fundamental programming models and algorithms used in mining Big Data for knowledge discovery.Specifically,the lecture will cover MapReduce,Frequent Itemset Mining,Clustering&Dimension Reduction,and Recommendation Systems.The assignments will include implementing algorithms introduced in the lecture to detect meaningful patterns from real datasets(e.g.,Yelp reviews,Amazon transactions,and MovieLens data).At the end of the course,the students are expected to conduct a research project by combining the knowledge learned in class to build a novel recommendation system.
個(gè)性化研究課題參考Suggested Research Fields
構(gòu)建基于內(nèi)容的電影推薦系統(tǒng)Content-based movie recommender
構(gòu)建基于協(xié)同過濾的推薦系統(tǒng)Building recommendation system based on collaborative filtering
構(gòu)建一個(gè)混合位置的餐廳推薦系統(tǒng)Building a hybrid recommendation system for location
數(shù)據(jù)挖掘其他應(yīng)用如:使用公開數(shù)據(jù)進(jìn)行空氣質(zhì)量預(yù)測和預(yù)報(bào)Other applications of data mining,such as air quality prediction and forecasting using open data
項(xiàng)目背景
當(dāng)你發(fā)現(xiàn)刷抖音停不下來,當(dāng)你在朋友圈里看到精準(zhǔn)的廣告投放,當(dāng)你讓Siri規(guī)劃回家路線,這背后的強(qiáng)大驅(qū)動(dòng)力便是數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)。數(shù)據(jù)挖掘又稱知識發(fā)現(xiàn),即從數(shù)據(jù)中挖掘知識。在當(dāng)下信息爆炸時(shí)代,面對龐大的數(shù)據(jù)庫,最主要的困難就是有效信息難以提煉,John Nalsbert稱之為“信息豐富而知識貧乏”窘境。因此,對海量數(shù)據(jù)進(jìn)行深入分析,發(fā)現(xiàn)并提取隱藏在其中的信息,以更好地利用這些數(shù)據(jù)的需求愈發(fā)強(qiáng)烈。但僅以數(shù)據(jù)庫系統(tǒng)的錄入、查詢、統(tǒng)計(jì)等功能,無法發(fā)現(xiàn)數(shù)據(jù)中存在的關(guān)系和規(guī)則,無法根據(jù)現(xiàn)有的數(shù)據(jù)預(yù)測未來的發(fā)展趨勢,更缺乏挖掘數(shù)據(jù)背后隱藏知識的手段。正是在這樣的條件下,數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。項(xiàng)目將圍繞數(shù)據(jù)挖掘原理及其在推薦系統(tǒng)中的應(yīng)用展開。
項(xiàng)目大綱介紹
面向大規(guī)模數(shù)據(jù)處理的并行計(jì)算模型和方法Introduction and MapReduce
頻繁項(xiàng)級挖掘算法及關(guān)聯(lián)規(guī)則Mining Frequent Itemsets
聚類分類與數(shù)據(jù)降維Clustering&Dimension Reduction
推薦系統(tǒng)Recommendation Systems
學(xué)術(shù)研討1:教授與各組學(xué)生探討并評估個(gè)性化研究課題可行性,幫助學(xué)生明晰后續(xù)科研思路Final Project Preparation Session I
學(xué)術(shù)研討2:學(xué)生將在本周課前完成程序設(shè)計(jì)原型(prototype)及偽代碼(Pseudocode),教授將根據(jù)各組進(jìn)度進(jìn)行個(gè)性化指導(dǎo),確保學(xué)生優(yōu)質(zhì)的終期課題產(chǎn)出Final Project Preparation Session II
項(xiàng)目成果展示 Final Presentation
>>沒有教授推薦信,缺少科研經(jīng)驗(yàn)?點(diǎn)擊這里提升背景<<