中國自動化學會專家咨詢工作委員會指定宣傳媒體
文摘詳情
gkongbbs

2021信息科學Top10發(fā)展態(tài)勢。深度學習?卷積神經網(wǎng)絡?

http://casecurityhq.com 2021-12-23 13:11 金藍??萍加邢薰?/a>

在科學研究、高性能計算、生命科學、仿真模型等各行業(yè)的迭代更新的今天,信息科學幾乎是所有學科中的基礎,所以夯實基礎勢在必行,信息科學是研究信息運動規(guī)律和應用方法的科學,是由信息論、控制論、計算機理論、深度學習理論、人工智能理論、加速存儲理論和系統(tǒng)論相互滲透、相互結合而成的一門新興綜合性科學。其支柱為信息論、系統(tǒng)論和控制論。

背景+

科學研究的世界呈現(xiàn)出蔓延生長、不斷演化的景象??蒲泄芾碚吆驼咧贫ㄕ咝枰莆湛蒲械倪M展和動態(tài),以有限的資源來支持和推進科學進步。對于他們而言,洞察科研動向、尤其是跟蹤新興專業(yè)領域對其工作具有重大的意義。

為此,發(fā)布了 “信息科學”數(shù)據(jù)和報告。定義一個被稱作信息科學的專業(yè)領域的方法,源自于科學研究之間存在的某種特定的共性。這種共性可能來自于實驗數(shù)據(jù),也可能來自于研究方法,或者概念和假設,并反映在研究人員在論文中引用其他同行的工作這一學術行為之中。

通過持續(xù)跟蹤全球最重要的科研和學術論文,研究分析論文被引用的模式和聚類,特別是成簇的高被引論文頻繁地共同被引用的情況,可以發(fā)現(xiàn)信息科學。 當一簇高被引論文共同被引用的情形達到一定的活躍度和連貫性時,就形成一個信息科學,而這一簇高被引論文便是組成該信息科學的“核心論文”。信息科學的分析數(shù)據(jù)揭示了不同研究者在探究相關的科學問題時會產生一定的關聯(lián),盡管這些研究人員的背景不同或來自不同的學科領域。

總之,信息科學的分析提供了一個獨特的視角來揭示科學研究的脈絡。信息科學的分析不依賴于對文獻的人工標引和分類(因為這種方法可能會有標引分類人員判斷的主觀性),而是基于研究人員的相互引用而形成的知識之間和人之間的聯(lián)絡。這些信息科學的數(shù)據(jù)連續(xù)記載了分散的研 究領域的發(fā)生、匯聚、發(fā)展(或是萎縮、消散),以及分化和自組織成更近的研究活動節(jié)點。在演進的過程中,每組核心論文的基本情況,如主要的論文、作者、研究機構等,都可以被查明和跟蹤。通過對該信息科學的施引論文的分析,可以發(fā)現(xiàn)該領域的最新進展和發(fā)展方向。

2021 年,在以往系列信息科學報告的基礎上,推出了《2021信息科學》分析報告。報告仍然以文獻計量學中的共被引分析方法為基礎, 基于Essential Science Indicators™ (ESI)數(shù)據(jù)庫中的 12147 個信息科學,遴選出了 2021年自然科學和社會科學的11大學科領域排名最前的110個信息科學和61個新興前沿。

方法論+

整個分析工作分為兩個部分:信息科學的分析和重點信息科學(包括重點信息科學和重點新興前沿)的遴選及解讀由中國科學院科技戰(zhàn)略咨詢研究院科技戰(zhàn)略情報研究所主持完成。 此次分析基于2015-2020年的論文數(shù)據(jù)。

1.1信息科學的遴選與命名

《2021信息科學》分析報告反映了當前自然科學與社會科學的11大學科領域的171個信息科學(包括110個熱點前沿和61個新興前沿)。我們以ESI數(shù)據(jù)庫中的12147個信息科學為起點,遴選目標是要找到那些較為活躍或發(fā)展迅速的信息科學。報告中所列的171個信息科學的具體遴選過程如下:

1.1.1熱點前沿的遴選

首先把ESI數(shù)據(jù)庫的20個學科劃分到11①個高度聚合的大學科領域中,然后對每個ESI學科中的信息科學的核心論文,按照總被引頻次進行排序,提取排在每個ESI學科前10%的最具引文影響力的信息科學,并將其整合到11大學科領域中,以此數(shù)據(jù)為基礎,再根據(jù)核心論文出版年的平均值重新排序,遴選出每個領域中那些“最年輕”的信息科學,并由各學科戰(zhàn)略情報研究人員進行調整和歸并。通過上述幾個步驟在每個大學科領域分別選出10個熱點前沿,共計110個熱點前沿。 因為每個領域具有不同的特點和引用行為,有些學科領域中的很多信息科學在核心論文數(shù)和總被引頻次上會相對較小,所以從11 大學科領域中分別遴選出的排名前10的熱點前沿,代表各大學科領域中最具影響力的信息科學, 但并不一定代表跨數(shù)據(jù)庫(所有學科)中最大最熱的信息科學。

1.1.2新興前沿的遴選

一個信息科學有很多新近的核心論文,通常提示其是一個快速發(fā)展的專業(yè)研究方向。為了選取新興的前沿,組成信息科學的基礎文獻即核心論文的時效性是優(yōu)先考慮的因素。這就是為什么我們稱其為新興前沿。為了識別新興前沿,我們對信息科學中的核心論文的出版年賦予了更多的權重或優(yōu)先權,只有核心論文平均出版年在2019年6月之后的信息科學才被考慮,將每個ESI學科的信息科學按被引頻次從高到低排序,選取被引頻次排在前10% 的信息科學,然后各學科戰(zhàn)略情報研究人員經過調研和評審,遴 選出每個ESI學科中的新興前沿, 并將其整合到11大學科領域中, 從而遴選出了 11大學科領域的61 個新興前沿,這61個新興前沿最早的平均出版年是2019.5。遴選不限定學科,因此61個新興前沿在11大學科領域中分布并不均勻, 例如,數(shù)學領域沒有新興前沿入選,物理學、地球科學、信息科學等領域分別只有一個新興前沿,而臨床醫(yī)學領域則選出了29個新興前沿。通過以上兩種方法,這份報告突出顯示了 11個高度聚合的大學科領域中的110個熱點前沿和61個新興前沿。

1.1.3信息科學的命名

由各學科戰(zhàn)略情報研究人員, 根據(jù)信息科學的核心論文的研究主題、主要內容和特點等,對171個信息科學逐一進行命名,并征求專家意見調整確定。

1.2信息科學的分析及重點信息科學的遴選和解讀

本報告在遴選的171個信息科學的數(shù)據(jù)的基礎上,由中國科學院科技戰(zhàn)略咨詢研究院的戰(zhàn)略情報研究人員對11大學科領域的110個熱點前沿的發(fā)展趨勢進行了分析,并對31個重點信息科學和 2個前沿群進行了詳細的解讀(見后續(xù)各章)。重點信息科學包括重點熱點前沿和重點新興前沿兩部分。

信息科學由一組高被引的核心論文和一組共同引用核心論文的施引文獻組成。核心論文來自于ESI數(shù)據(jù)庫中的高被引論文,即在同學科同年度中根據(jù)被引頻次 排在前1%的論文。這些有影響力的核心論文的作者、機構、國家在該領域做出了不可磨滅的貢獻, 本報告對其進行了深入分析和解讀。同時,引用這些核心論文的施引文獻可以反映出核心論文所提出的技術、數(shù)據(jù)、理論在發(fā)表之后是如何被進一步發(fā)展的,即使這些引用核心論文的施引文獻本身并不是高被引論文。

1.2.1重點信息科學的遴選

2014年設計了遴選重點信息科學的指標CPT,2015年在年篇均被引頻次(CPT)指標的基礎上, 又增加了規(guī)模指標,即核心論文數(shù)(P)。

(1)核心論文數(shù)(P)

ESI數(shù)據(jù)庫用共被引文獻簇(核心論文)來表征信息科學, 并根據(jù)文獻簇的元數(shù)據(jù)及其統(tǒng)計結果揭示信息科學的發(fā)展態(tài)勢, 其中核心論文數(shù)(P)總量標志著信息科學的大小,文獻簇的平均出版年和論文的時間分布標志著 信息科學的進度。核心論文數(shù)(P)表達了信息科學中知識基礎的重要程度。在一定時間段內,—個前沿的核心論文數(shù)(P)越大,表明該前沿越活躍。

(2)年篇均被引頻次(CPT)

遴選重點信息科學的指標年篇均被引頻次(CPT)的計算方法是核心論文的總被引頻次(C)除以 核心論文數(shù)(P),再除以施引文獻所發(fā)生的年數(shù)(T)。“施引文獻所發(fā)生的年數(shù)”指施引文獻集合中最新發(fā)表的施引文獻與最早發(fā)表的施引文獻的發(fā)表時間的差值。如最新發(fā)表的施引文獻的發(fā)表時間為2020年,最早發(fā)表的施引文獻的發(fā)表時間為2016年,則該施引文獻所發(fā)生的年數(shù)為4。

CPT實際上是一個信息科學的平均引文影響力和施引文獻發(fā)生年數(shù)的比值,該指標越高代表該前沿越熱或越具有影響力。它反映了某信息科學的引文影響力的廣泛性和及時性,可以用于探測信息科學的突現(xiàn)、發(fā)展以及預測信息科學下一個時期可能的發(fā) 展。該指標既考慮了某信息科學受到關注的程度,即核心論文的總被引頻次,又考慮了該信息科學受關注的時間長短,即施引文獻所發(fā)生的年數(shù)。

在信息科學被持續(xù)引用的前提下,當兩個信息科學的P和T值分別相等時,則C值較大的信息科學的CPT值也較大,指示該信息科學引文影響力較大。

當兩個信息科學的C和P值分別相等時,則T值較小的信息科學的CPT值會較大,指示該信息科學在短期內受關注度較高。

當兩個信息科學的C和T值分別相等時,P值較小的信息科學的CPT反而會較大,指示該信息科學中核心論文的平均引文影響力較大。

《2021信息科學》在重點信息科學的遴選過程中,從每個大學科領域的10個“熱點前沿”中, 利用核心論文數(shù)(P)和CPT指標,結合戰(zhàn)略情報研究人員的專業(yè)判斷,遴選出兩個重點熱點前沿。 專業(yè)判斷主要考慮該前沿是否對解決重大問題有重要意義。一方面, 選擇核心論文數(shù)(P)最高的前沿, 如果P最高的前沿已經在往年的研 究前沿中解讀過且核心論文沒有顯著變化,則選擇P次高的前沿, 依次類推。同時,用CPT指標結合專業(yè)判斷遴選出一個重點熱點前沿。綜合這兩種方法共遴選出22 個重點熱點前沿。從新興前沿中, 利用CPT指標結合戰(zhàn)略情報研究人員的判斷遴選出9個重點新興前 沿和2個新興刖沿群。因此從171 個信息科學中共遴選出31個重點前沿和2個前沿群進行深入解讀。

1.2.2信息科學的分析和解讀

在報告遴選的171個信息科學的數(shù)據(jù)基礎上,綜合分析11大學科領域的110個熱點前沿的發(fā)展趨勢,研究揭示新興前沿的研究主題, 并對33個重點信息科學(群)進行了詳細的解讀。

(1)熱點前沿分析及重點熱點前沿的解讀

對于每個學科領域,結合TOP10熱點前沿的核心論文的數(shù)量、被引頻次、核心論文平均出版年,以及施引論文的年度變化,分析TOP10熱點前沿的發(fā)展趨勢, 包括覆蓋的重點方向、前沿(群) 分布特征及演變趨勢。

每個學科領域的第一張表展示各自的前10個熱點前沿的核心論文的數(shù)量、被引頻次以及核心論文平均出版年。每個領域的10個熱點信息科學中引用核心論文的論文(施引文獻)的年度分布用氣泡圖的方式展示。氣泡大小表示每年施引文獻的數(shù)量,對于那些施引文獻量大、而施引文獻所發(fā)生的年數(shù)少的前沿,也就是CPT值的前兩種情況,可以從圖中直觀地看出哪些是重點熱點前沿。但是對于核心論文(P)較少的情況,則需要結合數(shù)據(jù)來看。大部分信息科學的施引文獻每年均有一定程度的增長,因此氣泡圖也有助于對信息科學發(fā)展態(tài)勢的理解。

對每個學科領域遴選出的兩個重點熱點前沿,深入分析解讀其概念內涵、發(fā)展脈絡、研究力量布局等,揭示被引頻次較高的核心論文的研究內容、價值、影響。

每個重點熱點前沿的第一張表對該熱點前沿的核心論文的產出國家、機構活躍狀況進行了統(tǒng)計分析, 有助于揭示出哪些國家、機構在該熱點前沿中有較大貢獻。第二張表 則對該熱點前沿的施引文獻的產出國家和機構進行了統(tǒng)計分析,有助于探討哪些國家、機構在該熱點前沿的發(fā)展中的研究布局。

(2)新興前沿分析及重點新興前沿的解讀

新興前沿的體量(核心論文及 其施引文獻)較小,統(tǒng)計數(shù)據(jù)的分析意義不大。因此,主要由戰(zhàn)略情報研究人員揭示新興前沿的研究主題,并對重點新興前沿的核心論文及相關信息進行內容方面的定性分析解讀,籍此可以了解重點新興前沿的基本概念、最新科研突破及未來發(fā)展前景。

信息技術+

1.熱點前沿及重點熱點前沿解讀

1.1信息科學領域Top 10熱點前沿發(fā)展態(tài)勢

信息科學領域位居前十位的熱點前沿主要集中于面向6G通信、 植物分類和病害檢測、心電圖分類和心率失常自動診斷、人類活動識別、視頻動作識別、多模態(tài)情感分析、電子健康檔案數(shù)據(jù)挖掘等領域的深度學習方法研究,以及區(qū)塊鏈技術、通路數(shù)據(jù)庫、無人機輔助通信技術等方向,與深度學習相關的主題占據(jù)了今年Top10 熱點前沿的大部分主題。“基于無人機的無線通信技術”是2020年熱點前沿“無人機無線通信網(wǎng)絡、 傳輸保密和軌跡優(yōu)化研究”的延續(xù)和擴展,其他前沿主題均為首次入選。

信息科學領域Top 10熱點前沿

信息科學領域Top 10熱點前沿的施引論文

1.2重點熱點前沿一“面向視頻動作識別的深度神經網(wǎng)絡研究”

隨著視頻設備和網(wǎng)絡的普及,視頻理解和動作識別吸引了越來越多研究者的關注。相比圖像來說, 視頻內容和背景更加復雜多變,不同的動作類別之間具有相似性,而相同的類別在不同環(huán)境下又有著不同的特點。目前,視頻動作識別常用的技術有基于人工特征的視頻動作識別、基于雙流的神經網(wǎng)絡、基 于三維卷積的神經網(wǎng)絡等。在實際應用中,精確的動作識別有助于輿情監(jiān)控、廣告投放、視頻檢索、智能醫(yī)療監(jiān)控、自動駕駛和交通安防等相關的任務。

熱點前沿“面向視頻動作識別 的深度神經網(wǎng)絡研究”包含13篇 核心論文,內容涵蓋視覺基因組 (Visual Genome)數(shù)據(jù)集、動作識別的時空表示學習、深層視覺語義對齊、基于長期遞歸卷積網(wǎng)絡的視覺識別和描述、長期時間卷積動作識別、用于動作識別的非對稱三維卷積神經網(wǎng)絡、用于動作識別的時空可變形三維注意網(wǎng)絡。在被引頻次超過100次的7篇核心論文中 ,美國主導發(fā)表3篇,分別來自加州大學伯克利分校和斯坦福大學,后者貢獻兩篇;中國主導發(fā)表2篇,分別來自中國科學院深圳先進技術研究院和天津大學;法國主導發(fā)表2篇,分別來自法國國家信息與自動化研究所和法國國家科學研究中心。

在13篇核心論文中,被引頻次最高的是加利福尼亞大學伯克利分校Jeff Donahue博士 2017年發(fā) 表在《IEEE Transactions on Pattern Analysis and Machine Intelligence^ 上 的 “Long-Term Recurrent Convolutional Networks for Visual Recognition and Description”,被引209次,文章提出一個長期時間遞歸卷積網(wǎng)絡(LRCN)模型,一種適用于大規(guī)模視覺學習的端到端可訓練的新型遞歸卷積結構,并展示了這些模型在基準視頻識別任務、圖像描述和檢索問題以及視頻敘述挑戰(zhàn)方面的價值。被引頻次較高的論文 還包括斯坦福大學李飛飛團隊2017 年發(fā)表在 “International Journal of Computer Vision^ 上的“Visual Genome: Connecting Language and Vision Using Crowdsourced Dense Image Annotations",該論文利用眾包 方法構建了視覺基因組(Visual Genome)數(shù)據(jù)集,這是第—大 規(guī)模的視覺關系數(shù)據(jù)集,提供物體的交互和屬性的詳細標簽,將語義和圖像結合起來,推動人工智能的進一步發(fā)展。Visual Genome是李飛飛教授團隊后ImageNet時代在計算機理解圖片上的訓練和測試數(shù)據(jù)集的又一重要成果。

美國和中國各貢獻5篇核心論文,法國貢獻3篇,荷蘭和英國各貢獻2篇。從核心論文的機構分布看,法國布列塔尼盧瓦爾大學、法國國家信息與自動化研究所和中國科學院各貢獻3篇并列第一,美國斯坦福大學貢獻2篇排名第二。

“面向視頻動作識別的深度神經網(wǎng)絡研究”研究前沿中核心論文的Top產出國家和機構

施引論文的角度來看,中國表現(xiàn)最突出,以630篇施引論文遙遙領先排名第二的美國(176篇),英國、澳大利亞、印度、 韓國等也表現(xiàn)不俗。施引論文Top產出機構全部為中國機構,中國科學院、天津大學、浙江大學位列前三甲,表明中國一批大學和科研機構在該前沿迅速開展了跟進研究, 并產出了眾多研究成果。

“面向視頻動作識別的深度神經網(wǎng)絡研究”研究前沿中施引論文的Top產出國家和機構

1.3重點熱點前沿一“基于無人機的無線通信技術”

隨著物聯(lián)網(wǎng)應用的普及,無線網(wǎng)絡將支持數(shù)量龐大的接入設備, 當前的蜂窩基礎架構將迎接巨大的挑戰(zhàn)。而僅依靠部署傳統(tǒng)的地面基站很難實現(xiàn)萬物互聯(lián),例如,在偏遠或者地勢險峻的區(qū)域部署地面基站面臨著成本高、部署難度大的問題;在災害發(fā)生區(qū)域和體育賽場等緊急和臨時的特殊場景中,地面基站可能會出現(xiàn)過載甚至發(fā)生故障, 而臨時部署地面通信設施耗時且耗資巨大。隨著低成本、小型化和集成化無人機在民用和工業(yè)領域的廣泛應用,將無人機作為空中基站輔助地面通信成為解決臨時性特殊區(qū)域通信問題的有效方案,也使搭載先進收發(fā)信機和智能傳感設備進行高速數(shù)據(jù)傳輸成為無線通信領域的又一新的研究熱點。在2021 年7月中國河南省多地遭遇強降雨期間,搭載了移動公網(wǎng)基站的“翼 龍” -2H無人機空中應急通信平臺,實現(xiàn)了約50平方公里范圍5小時的連續(xù)穩(wěn)定移動信號覆蓋,打通應急通信保障生命線。

熱點前沿“基于無人機的無線通信技術”包含11篇核心論文,聚焦于通過無人機軌跡優(yōu)化提高能量效率;下行通信中多用戶最小吞吐量的最大化方案,包括通過優(yōu)化多用戶通信調度和關聯(lián)以及無人機的軌跡和功率控制來實現(xiàn),通過聯(lián)合優(yōu)化無人機軌跡和正交頻分多址資源分配來實現(xiàn)等;使用戶覆蓋數(shù)量最大化的無人機車載基站部署算法等。被引頻次在300次以上的論文共有5篇,其中4篇來自新加坡國立大學,另一篇來自美國弗吉尼亞理工大學。被引頻次最高的論文是新加坡國立大學 Zeng, Yong等人于2016年發(fā)表在《IEEE Communications Magazine》 上 的 “Wireless Communications with Unmanned Aerial Vehicles: Opportunities and Challenges” 一文,被引729次。文章概述了無人機輔助無線通信的基本網(wǎng)絡架構和信道特性,重點介紹了通信系統(tǒng)的 關鍵設計考慮因素,以及有待開發(fā)的新機遇。

新加坡貢獻了該前沿的大部分研究工作。從核心論文的機構分布看,新加坡國立大學發(fā)表的核心論文最多;華為公司的法國研發(fā)中心與法國巴黎薩克雷大 學、美國弗吉尼亞理工大學和芬蘭奧盧大學合作發(fā)表2篇論文。

“基于無人機的無線通信技術“研究前沿中核心論文的Top產出國家和機構

2.新興前沿及重點新興前沿解讀

2.1新興前沿概述

信息科學領域有1項研究入選新興前沿,“利用醫(yī)學影像檢測和診斷新冠肺炎的深度神經網(wǎng)絡研究”。

2.2重點新興前沿解讀一“利用醫(yī)學影像檢測和診斷新冠肺炎的深度神經網(wǎng)絡研究”

與新冠肺炎作斗爭的一個關鍵步驟是對受感染患者進行有效篩查,以便受感染的病人能夠立即得 到治療和護理,并被隔離以減輕病毒的傳播。如何利用先進的人工智能深度學習技術迅速、準確地識別出新冠肺炎病情成為信息科學領域 的新興重點研究方向。

該前沿圍繞著如何利用深度學習技術在醫(yī)學影像數(shù)據(jù)中迅速識別新冠肺炎展開研究。在數(shù)據(jù)源方面,大部分研究使用X光片進行自動識別,有2篇文獻采用CT影像數(shù)據(jù)進行識別。在疫情初期,由于可用的數(shù)據(jù)集較小,部分研究采用數(shù)據(jù)增強的方法進行深度學習訓練,提升對新冠肺炎的識別性能。在識別方法方面,涉及了輔助分類器生成對抗網(wǎng)絡(GAN)、深度遷移學習方法、多目標差分進化卷積神經網(wǎng)絡、Deep Bayes-Squeeze Net等。

版權所有 中華工控網(wǎng) Copyright?2024 Gkong.com, All Rights Reserved