1
研究室 杉浦研究室 教員 杉浦 淳 カテゴリー 地域産業支援プラットフォーム Osaka Industrial Technology Platform OIT-P 産学連携に質するパテントマップ構築に関して,地域中小企業での活用を念頭に,低コストで実現できる知財情報分析スキームの設計を進めている.これに先立ち,実務経験者を中心とした研究会,意見交換の実 施により,商用データベース・分析サービスの現状と活用,オープンソースライブラリ,フリーソフトウェアを用いた定性分析・定量分析を通して,仮想事例を設定した調査・分析スキームのモデル化を進めてきた. また,簡易言語であるPython を中心に展開されているWEBスクレイピング,分析用ライブラリを用い,知財情報への適用可能性を調査した.さらに,近年注目されているIPランドスケープについて,その本質や産学連携 マッチングにおける有用性について,産官学の立場からのヒアリングを中心に情報収集を進めている. 中小企業との産学連携における 低コストの特許情報分析手法 0 2 4 成分2 (1.55%) 情報 手段 部材 玩具 複数 データ システム 方向 端末 当該 ユーザ ステップ 形状 方法 状態 学生 サーバ 部分 1つ 本体 所定 音声 磁石 構造 組立 対象 単語 立体 表面 工程 セット ユニット 空間 部品 信号 画面 知育 文字 中心 情報処理 相互 電子 2つ 平面 各々 無線 範囲 物体 開口 ページ 内容 データベース ゲーム パラメータ パターン 要素 カード 一つ チケット 媒体 内部 側面 弾性 ファイル ドット 撮像 条件 座標 パズル スイッチ 単位 ID 機器 目標 ネットワーク ポイント 項目 外部 コード 属性 子供 科目 同一 発話 コンテンツ 部位 立方体 テーブル 周辺 ケース 回路 寸法 外側 裏面 種類 内側 一対 角度 機構 棒状 リング 自己 背景 式部 上部 リスト 組み合わせ 対向 手順 筆記具 形態 材料 場所 円筒 生徒 側壁 スクリーン 上面 漫画 動物 両端 時刻 テキスト パネル 段階 固有 数字 教師 三次元 デジタル 先端 水平 外面 言語 任意 能力 サイズ レベル 視覚 図書 ボード 基本 コマ プロセッサ 外形 矩形 出口 キャラクター 円形 キャラクタ リアルタイム コンテキスト 一端 内面 下部 基部 メモリ 印刷物 底面 アイテム 液体 向き 周波数 3つ グループ 一辺 表題 テーマ メッセージ 一体 外国 順序 人間 感情 動き 用具 カテゴリ コミュニケーション ペン 原稿 装置 形成 記憶 構成 取得 接続 対応 連結 制御 学習 送信 検出 入力 操作 配置 選択 管理 識別 受信 出力 生成 回転 設定 処理 移動 プログラム 保持 動作 携帯 算出 通信 利用 教育 評価 機能 特定 作成 登録 スキャン 仮想 支援 提供 固定 格納 実行 授業 抽出 描画 出席 決定 使用 結合 要求 成形 設置 関係 記録 配信 認識 突出 装着 変形 発生 計算 関連 収納 接触 再生 履修 検知 質問 左右 印刷 駆動 受付 挿入 解答 分割 記入 展開 近似 指示 保存 更新 配列 変更 着脱 予定 具備 講義 隣接 指導 表現 存在 受講 供給 試験 定義 行動 保護 切断 直交 アクセス 接合 貫通 解除 上下 判断 活動 意味 一定 正解 比較 類似 変換 習得 傾斜 診断 解析 付与 通知 閉鎖 レポート 対話 連動 参照 交差 表記 置換 蓄積 一致 調整 分離 命令 開始 伝達 パス 平行 垂直 必要 完全 コンピュータ モジュール tensorflow R Python 母集団からトレンド,シーズの少 ない領域などを捉える. 機械学習を用いた辞書整備,文書マッ ピングにより,低コストでの分析ス キーム構築を目指す. Black Box カスタマイズ システム理解 自由度の高い パラメータ調整 思考錯誤 による理解 Input Output Black Box Black Box 処理の流れ が明確 ブラックボック スは数式レベル 結果の妥当性を考察し つつシステム調整 SMEを対象とするため,IT人材の確保が困難であることが多い.また 分析スキームを提示したところで,継続的な実践のためのノウハウが 継承されにくい.そのため,ブラックボックスを極力避ける意味で,OSS やフリーウェアを積極的に導入し,分析作業の効率化を推進する. これにより,コンサルティング後のサポートに寄るのではなく,自己解 決によるアップデート,刷新を実践できる環境構築を目指す. 産学連携マッチングを目的とした調査・分析スキームのモデル化については,幾つかの研究課題において整理した段階にある.それに伴うICTAI 技術の適用についても,ステージ毎の単発的な実施ではあるが,実現可 能性を検証済みである. 今後はこれらをまとめて一連のシステムとして提案する作業に入る.ただし,当活動の課題としては,SMEを対象としたスキーム提供を目的とするため,完結したアプリケーション開発を目指すのではなく,フリーウェア・ OSS を用いた「調査・分析ステージ」と「ノウハウ」を紐づけたスキームとして提供することにある.継続性の保証がないOSSFWの存在に依存するため,継続利用におけるリスクについても十分に考慮しつつ,実際のマッチン グ課題への適用により,運用レベルへと展開する. 知財情報分析スキームの提供 OSSを利用した低コストの分析アプローチ ニーズ調査 (ヒアリング) シーズ発掘 事業化構想 クリアランス調査 具体的施策 (特許・論文許調査) (アイデア創出) (先行技術調査) (事業化の準備) 社内スタッフのICT スキル,継続可能 性を考慮した分析 スキームを模索 J-PlatPat等のオー プンデータを利用 した情報収集とDB 構築 Pythonによるスク レイピング,RSSよる収集の効率化 事業展開を考慮した検 索・分析に可視化ノウハ ウを提供(RExcelユーザのICTスキル・データ規模 により,テキストマイニングを OSSやライブラリを利用して実 践. 検索・収集・分析ノウハウの提供 特許・論文情報を提供するデータベースは,有償・無償を問わず多く存在する.商用デー タベースサービスを利用すれば,検索は容易であり,特殊な分析ツールも備わっているこ とがほとんどである.しかし,大規模分析には向いているものの,知財の知識・システム の理解がなければ実施内容がブラックボックス化し,結果を捉えることが困難である. よって,本プロジェクトでは無償データベースを基本とし,検索対象の構造や特性に関す る知識獲得の効果も含めて,その情報整理から始まり,活用までのノウハウ提供を実践 する. これは,知的財産情報収集・分析の普及活動としての側面もあり,SMEにおける知財活用 の活性化を目論む施策である. 検索式構成ノウハウ DB構築・可視化ノウハウの提供 情報資源の選択 分析の実践例(Rを利用) (共同研究者) 三浦・長谷川・杉山

中小企業との産学連携における 低コストの特許情報分析手法 · Pythonによるスク レイピング,RSSに よる収集の効率化 事業展開を考慮した検

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 中小企業との産学連携における 低コストの特許情報分析手法 · Pythonによるスク レイピング,RSSに よる収集の効率化 事業展開を考慮した検

研究室 杉浦研究室 教員 杉浦淳 カテゴリー

地域産業支援プラットフォーム Osaka Industrial Technology Platform

OIT-P

産学連携に質するパテントマップ構築に関して,地域中小企業での活用を念頭に,低コストで実現できる知財情報分析スキームの設計を進めている.これに先立ち,実務経験者を中心とした研究会,意見交換の実

施により,商用データベース・分析サービスの現状と活用,オープンソースライブラリ,フリーソフトウェアを用いた定性分析・定量分析を通して,仮想事例を設定した調査・分析スキームのモデル化を進めてきた.

また,簡易言語であるPythonを中心に展開されているWEBスクレイピング,分析用ライブラリを用い,知財情報への適用可能性を調査した.さらに,近年注目されているIPランドスケープについて,その本質や産学連携

マッチングにおける有用性について,産官学の立場からのヒアリングを中心に情報収集を進めている.

中小企業との産学連携における低コストの特許情報分析手法

-2 -1 0 1

-4-2

02

4

成分1 (2.55%)

成分

2 (

1.5

5%

)

情報手段

部材

玩具

画像

複数

データ

システム

方向

端末当該

ユーザ

ステップ

形状方法

状態

学生

サーバ

経路

部分

1つ

本体

所定

領域

音声

磁石

構造

組立

対象

単語

立体

表面

地図

現実

工程

セット

タグ

ユニット

空間

部品

信号

映像

画面

知育

文字

中心

情報処理

相互

電子

2つ平面

各々

無線

範囲

物体開口

ページ

内容

データベース

ゲーム

カメラ

パラメータ

目的

パターン

要素

カード

一つ

チケット媒体

内部側面

弾性

ファイル

方位

エア

ドット

撮像

条件

座標

パズル

スイッチ

単位

ID

機器

目標

ネットワーク

ポイント

項目

外部

コード

属性

子供

科目

球体

同一

発話

地点

コンテンツ

部位立方体

テーブル

周辺ケース

回路

寸法

外側

裏面

種類

内側

一対

角度

機構棒状

リング

自己

背景

式部

上部

リスト

組み合わせ

対向

手順

筆記具

形態

材料

場所

円筒

生徒

側壁

スクリーン

上面

漫画

動物

両端

時刻テキスト

パネル

段階

固有

自動車

数字

教師

三次元

デジタル

道路

先端

水平

外面

言語

任意

能力

サイズ

レベル

視覚

写真

図書

ボード基本

コマ

プロセッサ

前方

外形

矩形

出口

キャラクター

円形

キャラクタ

リアルタイム

コンテキスト

一端

内面

下部

基部

メモリ印刷物

底面

アイテム

液体

向き

周波数

3つ

グループ

一辺

表題

テーマ

メッセージ

一体

外国

順序

人間 感情

動き

用具

カテゴリ

コミュニケーション

ペン

原稿

表示

装置

位置

形成

記憶

構成

取得

接続

対応連結

制御

学習

送信

検出

入力

操作

配置

選択

管理識別受信

出力

生成

回転 設定処理

移動 プログラム

施設

保持

動作

撮影

携帯算出

通信

利用

教育

評価

機能

案内

拡張

特定

作成

登録

スキャン

仮想

支援

提供

固定

格納

実行

授業

抽出

描画

出席

決定

使用

結合

建造

要求

成形設置

関係

記録

配信

認識突出

装着

変形

発生

計算

関連

指定

収納

接触

再生

履修

検知

質問

左右

印刷

駆動

探索

受付挿入

解答

進行

分割

記入

展開

近似

指示

保存

更新

配列

変更着脱

予定

具備

講義

リンク

隣接

指導

表現

存在

受講

供給

試験

定義

行動

保護

マーク

切断

直交

アクセス

接合

貫通

重畳

解除

上下

判断

活動

意味

一定

正解

比較

類似

変換

習得

傾斜

診断

解析

種別

付与

通知閉鎖

車載

レポート

対話

避難

連動

参照

交差

通過

表記

置換

蓄積

一致

相当

調整

観察

分離

命令

開始

通行

伝達

付パス

搭載

平行

垂直

必要

完全

コンピュータ

モジュール

tensorflow

R

Python

母集団からトレンド,シーズの少ない領域などを捉える.

機械学習を用いた辞書整備,文書マッピングにより,低コストでの分析スキーム構築を目指す.

Black Box

カスタマイズ

システム理解

自由度の高いパラメータ調整

思考錯誤による理解

Input Output

Black Box

Black Box

処理の流れが明確

ブラックボックスは数式レベル

結果の妥当性を考察しつつシステム調整

SMEを対象とするため,IT人材の確保が困難であることが多い.また

分析スキームを提示したところで,継続的な実践のためのノウハウが

継承されにくい.そのため,ブラックボックスを極力避ける意味で,OSS

やフリーウェアを積極的に導入し,分析作業の効率化を推進する.

これにより,コンサルティング後のサポートに寄るのではなく,自己解

決によるアップデート,刷新を実践できる環境構築を目指す.

産学連携マッチングを目的とした調査・分析スキームのモデル化については,幾つかの研究課題において整理した段階にある.それに伴うICT・AI技術の適用についても,ステージ毎の単発的な実施ではあるが,実現可

能性を検証済みである.

今後はこれらをまとめて一連のシステムとして提案する作業に入る.ただし,当活動の課題としては,SMEを対象としたスキーム提供を目的とするため,完結したアプリケーション開発を目指すのではなく,フリーウェア・OSS

を用いた「調査・分析ステージ」と「ノウハウ」を紐づけたスキームとして提供することにある.継続性の保証がないOSSやFWの存在に依存するため,継続利用におけるリスクについても十分に考慮しつつ,実際のマッチン

グ課題への適用により,運用レベルへと展開する.

知財情報分析スキームの提供

OSSを利用した低コストの分析アプローチ

ニーズ調査

(ヒアリング)

シーズ発掘 事業化構想 クリアランス調査 具体的施策

(特許・論文許調査) (アイデア創出) (先行技術調査) (事業化の準備)

社内スタッフのICTスキル,継続可能性を考慮した分析スキームを模索

J-PlatPat等のオープンデータを利用した情報収集とDB構築

Pythonによるスクレイピング,RSSによる収集の効率化

事業展開を考慮した検索・分析に可視化ノウハウを提供(R・Excel)

ユーザのICTスキル・データ規模により,テキストマイニングをOSSやライブラリを利用して実践.

検索・収集・分析ノウハウの提供

特許・論文情報を提供するデータベースは,有償・無償を問わず多く存在する.商用デー

タベースサービスを利用すれば,検索は容易であり,特殊な分析ツールも備わっているこ

とがほとんどである.しかし,大規模分析には向いているものの,知財の知識・システム

の理解がなければ実施内容がブラックボックス化し,結果を捉えることが困難である.

よって,本プロジェクトでは無償データベースを基本とし,検索対象の構造や特性に関す

る知識獲得の効果も含めて,その情報整理から始まり,活用までのノウハウ提供を実践

する.

これは,知的財産情報収集・分析の普及活動としての側面もあり,SMEにおける知財活用

の活性化を目論む施策である.

検索式構成ノウハウ DB構築・可視化ノウハウの提供

情報資源の選択

分析の実践例(Rを利用)

(共同研究者)三浦・長谷川・杉山