rmapsympo2015_lecture04.pdf

Type: Document | Status: ready

JSTにおける情報分析と 活用について researchmapシンポジウム2015 情報企画部 情報分析室 黒沢 努

2 はじめに JSTにおける情報分析は誰のため?

1)国や政府・FAのため(研究資金を配分する側)

⇒ 研究資金を配分した成果・分野動向の把握

研究資金の効果的な配分・成果の最大化

2)大学のため(研究資金を受ける側)

⇒ 大学の成果の把握

研究テーマの見極め

3)企業のため(研究成果を展開する側)

⇒ 新しいビジネスの種

4)国民のため(研究資金の原資側)

⇒ 科学技術への理解

3 国 大学 企業 資源配分機関(FA) (JSPS,JST,NEDO等) 政策研究者 トムソン・エルゼビア JST JST情報分析室の立ち位置 政策のための科学 研究資金 シーズの創出 国民 成果の社会実装 ジーサーチ 税金 URA オンライン サービスの提供 (J-GLOBAL等) 科学技術情報の蓄積 分析ノウハウ集約 JST 情報 分析室 CSTI 戦略策定・評価等の ための基礎情報 業界情報や研究者 情報など意思決定を 支援する情報 大学の特色・強みを 顕在化する情報 国、大学、企業等に向け、パートナーと情報分析サービスを展開

4 JST情報分析室の立ち位置 高度な判断 JST情報分析室 利用者 情報分析 情報収集・蓄積 情報整理・体系化 解釈 意思決定 豊富な情報資源 の整備・蓄積 大学・企業 国・FA等 パートナー企業と 一緒に支援 JSTで直接支援 業務・事業背景を踏まえた情報分析を 利用者と一緒に実施。 論文 研究者 特許 ファンド情報 分析専門家

JST情報分析室の取り組み ミッション JSTでないと実現できない、高付加価値なDBの構築 と分析サービスの提供 ○JST内外の分析ニーズに応えるべく、情報分析室を組織化。 (総勢32名体制) ○オープンイノベーションの観点から他機関・民間企業の ノウハウの活用に加え、保有するデータセット連携を進め、
分析基盤を拡充。 ○プロフェッショナル人材は外部登用を推進。 ○将来的なインフォマティックス人材の育成。 5

戦略策定(政策、研究開発等)、研究開発投資成果パフォーマンス把握、 大学や企業等の研究活動に活用できる基礎エビデンスを体系的に整備 文献情報の蓄積 日本の研究者総覧 researchmap J-GLOBAL JDream J-STAGE 外部論文DB(内部分析用) 研究課題 研究者 文献 データ集約、関連付け <中核的な共通マスタ> 分析活用 Web上での検索、閲覧 (公開情報のみ) JSTが進める情報分析基盤の整備 ファンディング情報の蓄積 FMDB 日本の研究開発成果に係る ・研究課題(1959年~約3万件 ※JST課題) ・国内外の文献(1958 年~約4千万件) ・国内の特許(1993年~約1千万件) ・国内研究者(本人登録で約24万件) (文献及び特許から抽出した名寄せID約73万人) 6

7 目 的 ✓ 我が国の基礎研究(科研費・戦略事業等)情報・成果の把握及び公開と事業への実装 ✓ 政策・施策・事業・業務の企画・立案・運営・評価等の各段階に渡る土台(エビデンスベース)作り ✓ ALL JSTのマスター情報の整備と共用による業務効率の向上 FMDB 産業界等 科学 基 礎 産 業 化 大学 企業 (KAKEN) 横断利用 Web of Science®
専門的解析 <テキストマイニング・相関>

・各種研究情報に含まれるキーワード分析 ・キーワードの頻出・相関を時系列分析 等 シンプルなデータ把握・分析

・競争的資金・その成果等を一元把握 (基礎~産連・知財の諸事業情報) ・研究者アクティビティの把握 ・研究成果ベンチマーク 等 FMDBの主なデータ群 F M D B 解析情報 有用な解析ツール ・研究制度、課題情報、研究費、研究総括、研究 代表者、共同研究者、アドバイザリー情報等

・論文、特許、受賞、経歴、実施料等

・引用数、分野、キーワード、追跡調査等 7 Funding Management DataBase(FMDB) ~研究開発情報の活用と公開のための基盤的JST内部DB~

○国内の科学技術・医学系文献を網羅(1975~)

○国内研究者等約70万人を網羅(※1) (JST文献DBを高精度名寄せ)

○国内論文の引用文献整備を開始 (国内の学術誌/学会誌約2500誌※2 企業技報等1000誌) ※1 直近5年に国内文献で3本以上発表した著者数(約73万ID) ※2 H27にNII-CJPを含め約2,500誌計6年分の登載を予定 JSTが所有する論文情報の特徴 8 図1 JST文献DBとScopusの比較(JST調べ)

(参考)国内誌、海外誌の比較:分野毎の比率 (誌) 9 国内比率高

分析事例(機関分析) ○文献情報(国内外約3,600万件、特許情報(国内約1,000万件) を対象に機関名のゆらぎを同定。分割・統合対応も実施中。 (H27年度中を目標に実施中) ○機関の属性情報と組み合わせることで、業種や所在地等、 様々な切り口から多面的な分析が可能 ○産学連携等のセクター別の共同研究の状況や地域別の状況等を 論文データから容易に得ることが可能。 <従来>表記揺れや類似の機関の切分けが困難 例)名寄せ効果(論文の表記揺れ吸収) <機関名同定後>機関毎の正確な推移が把握可能 同定完了 10

分析事例(化学系企業の異業種連携) ●化学系企業が共著する異業種企業 ●化学系企業が共同出願する国立大学 ●化学系企業が共著する異業種(化学以外) ●化学系企業の地域分布(東京、大阪を除く)
11 分析事例(特定企業の研究動向) ●特許をよく共同出願している大学の推移 ●地域展開の推移(共同研究機関の所在地) ●文献における分野割合の推移 ●共著機関のネットワーク 12

13 萌芽領域の導出 「太陽電池関連テーマのこれからの領域は?」 分析事例(萌芽領域を探す) ○引用情報を活用して探す(※) 【手法】 JST文献3,917万件から、キーワードに「太陽電池」および「光電池」を含むもの。 (引用情報が付加された2007-2013年のデータが対象) ※ 引用情報解析手法は主に3種類(直接引用・共引用・書誌結合) 本件では直接引用関係を“学術俯瞰システムを用いて”分析。

文献DB 書誌情報 入手 引用ネットワーク 生成 最大連結成分に 絞る クラスタリング (引用情報のみ活用) 学術俯瞰システム 14 「学術俯瞰システム」とは 学術俯瞰システムは、大規模な書誌情報をテキストマイニングとネットワーク分析によ り自動分析し、学術分野の俯瞰を可能にするシステム

C#1 色素増感型 平均出版年 2007.3 論文数 1,121 リンク数 2,552 C#2 有機系 平均出版年 2008.6 論文数 983 リンク数 1,851 C#3 シリコン型 平均出版年 2003.9 論文数 562 リンク数 903 C#4 化合物型+量子型 平均出版年 2006.0 論文数 556 リンク数 829 C#5 化合物型 平均出版年 2006.3 論文数 410 リンク数 716 分析ツール提供 : 学術俯瞰システム(東京大学・イノベーション政策研究センター、および、東京工業大学・梶川研究室) 学術俯瞰マップ

論文の引用ネットワークを クラスター分析 15 C#17 ペロブスカイト太陽電池 平均出版年 2013.1 論文数 94 リンク数 143

C#1から自動分離された分野 JST文献: “太陽電池” or “光電池” 平均出版年 2005.9 対象論文数 6,207 (※) リンク数 10,617 クラスタ数 73 ※ JST文献の用語索引に「太陽電池」または「光 電池」を含み、 2007-2013年の引用で最大ネット ワークを構成した論文数

C#17 ペロブスカイト太陽電池 平均出版年 2013.1 論文数 94 リンク数 143 ペロブスカイト太陽電池とは 2009年の桐蔭横浜大学グループの発表以来、この6年 の間に20%強まで変換効率が上昇した次世代太陽電池。 低温溶液プロセスで安価に作製可能なことから、現在もっ とも注目されている次世代太陽電池(※) 他の分析との比較 2007-2014年におけるWeb of Science(WoS)のTOP1%論文 を学術俯瞰した結果(A)においても、論文数が急増してい る分野として同分野が検出された。 ※ JSTプレスリリース http://www.jst.go.jp/pr/announce/20150821/ 論文数急増中 ↓ 萌芽領域の検出 JGlobal: “太陽電池” or “光電池” 平均出版年 2005.9 対象論文数 6,207 (※) リンク数 10,617 クラスタ数 73 ※ J-Globalの文献の用語索引に「太陽電池」また は「光電池」を含み、 2007-2013年の引用で最大 ネットワークを構成した論文数 16

17 今後の予定 1.情報分析事例とノウハウの蓄積 1)分析事例の蓄積 ○ 戦略策定時の基礎データ ○ 研究動向の把握 ○ 萌芽領域の導出 ○ キーパーソンの導出 2)政策研究者等、パートナーとの連携 ○ 共同研究、パートナーを通じた利用者への分析支援

2.多様な分析に応える情報インフラの整備 1)既存の情報インフラの効果的な活用 ○ researchmapへ業績が集約されるような取り組み (JSTファンド採択研究者への登録奨励、FAでの活用) ○ 外部データベースとの継続的な連携(論文、ビジネス他) 2)情報分析基盤の継続的な整備

18 御清聴ありがとうございました