6NC:データサイエンス研修(NCCHD)
本講座は国立成育医療研究センター(NCCHD)のデータサイエンス研修に関する講義シリーズで構成されます。NCCHDでは2018年のAIホスピタル事業採択を機に、研究者、医師だけでなく、全ての職員を対象としたデータサイエンスの教育活動を行なっています。独自の研修方針で仲間を募り、特にコロナ禍を経て教育用動画の作成も行ってきました。2022年、ICRwebからこれらの動画を公開していただくことになり、データサイエンス研修とそこで作られている動画について紹介させていただきます。
本講座は国立成育医療研究センター(NCCHD)のデータサイエンス研修に関する講義シリーズで構成されます。NCCHDでは2018年のAIホスピタル事業採択を機に、研究者、医師だけでなく、全ての職員を対象としたデータサイエンスの教育活動を行なっています。独自の研修方針で仲間を募り、特にコロナ禍を経て教育用動画の作成も行ってきました。2022年、ICRwebからこれらの動画を公開していただくことになり、データサイエンス研修とそこで作られている動画について紹介させていただきます。
-
データサイエンス研修と公開動画の紹介《講師:岡村浩司》
データサイエンス研修と公開動画の紹介《講師:岡村浩司》
国立成育医療研究センターでは2018年のAIホスピタル事業採択を機に、研究者、医師だけでなく、全ての職員を対象としたデータサイエンスの教育活動を行なっています。独自の研修方針で仲間を募り、特にコロナ禍を経て教育用動画の作成も行ってきました。2022年、ICRwebからこれらの動画を公開していただくことになり、データサイエンス研修とそこで作られている動画について紹介させていただきます。本コンテンツに関する問い合わせは、6NC共通教育講座中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
これだけは使えるようになって欲しいマークダウン《講師:岡村浩司》
これだけは使えるようになって欲しいマークダウン《講師:岡村浩司》
データサイエンスやITCの習得過程では多量の情報に触れ、それらを整理してゆかねばなりません。ウィキやナレッジコミュニティ、またソースプログラムのホスティングサービスや、Jupyter Notebookなどを使って他者と情報共有する機会も増えてきます。HTMLに代わり、そのような状況で広く使われるようになった軽量マークアップ言語について解説します。この動画はNCCHD第115回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
Python 3 エンジニア認定基礎試験のご紹介《講師:伊藤愛主》
Python 3 エンジニア認定基礎試験のご紹介《講師:伊藤愛主》
一般社団法人Pythonエンジニア育成推進協会の主催する認定基礎試験を受けてみたので、そのご紹介です。例題も少し入れているので、挑戦してみると面白いですよ。Pythonの基礎学習の進捗として一つの形としておすすめです。この動画はNCCHD第121回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
プログラミング学習のステップアップを考えている人へ《講師:伊藤愛主》
プログラミング学習のステップアップを考えている人へ《講師:伊藤愛主》
プラグラミング学習で向上するための考え方の1プロセスをご紹介しています。つまずいたときの気分転換に役立てば嬉しいです。この動画はNCCHD第195回データサイエンス研修にて発表された内容を再収録したものです。本コンテンツに関する問い合わせは、6NC共通教育講座中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
Python学習 OpenCVで画像処理 ―画像上の多数の物体を輪郭で囲むスクリプト―《講師:塚本元子》
Python学習 OpenCVで画像処理 ―画像上の多数の物体を輪郭で囲むスクリプト―《講師:塚本元子》
Pythonで画像処理・画像解析を行う際に、OpenCVは多彩な機能を備える便利なライブラリです。多数の同じ物体が写った画像を加工して、OpenCVのコマンドを用いて物体を輪郭で囲むスクリプトを書いて実行してみます。対象物の輪郭を正確に囲むために、画像の特性に合った前処理を行い、スクリプトにフィルタリングやカラー方式の変換も行ってみます。この動画は第237回データサイエンス研修にて発表された内容を再収録したものです。本コンテンツに関するお問い合わせは、6NC共通教育講座中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
Pythonを用いた臨床データの処理と統計グラフ作成の基礎-IBD患者におけるMREデータを用いたROC曲線の作成-《講師:丘逸宏》
Pythonを用いた臨床データの処理と統計グラフ作成の基礎-IBD患者におけるMREデータを用いたROC曲線の作成-《講師:丘逸宏》
手持ちのPCでインストールのみで運用出来るJupyterLabを使ってプログラミングをします。実臨床で得られたデータを用いて、基本的なROC曲線の理解から作図、最適値の算出の仕方をゼロから行います。この動画はNCCHD第145回データサイエンス研修にて発表された内容を再収録したものです。本コンテンツに関する問い合わせは、6NC共通教育講座中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
プログラミングを試してみたいあなたへ-Google Colaboratoryのススメ-《講師:塚本元子》
プログラミングを試してみたいあなたへ-Google Colaboratoryのススメ-《講師:塚本元子》
手持ちのPCで環境構築が不要で、すぐプログラミングを始められるGoogle Colaboratory。実際の課題に取り組みながら、初期設定からファイルの読み込み、プログラミングの実行、結果の保存までをご紹介します。この動画はNCCHD第78回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
エイコサリンガルに挑戦-20プログラミング言語の比較-《講師:岡村浩司》
エイコサリンガルに挑戦-20プログラミング言語の比較-《講師:岡村浩司》
プログラミング言語、何か一つを習得することがきわめて重要なのですが、実際に仕事をしていると他の言語にも触れる機会が多くなり、かつ書かなければならないことも出てきます。ちょっとした書き方の違いが意外と苦痛なのですが、ここでは一気に20のプログラミング言語に触れて、その意識を変え、新しい言語の学習障壁を低くしてみたいと思います。この動画はNCCHD第98回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
プログラミング言語JuliaとPythonの比較《講師:岡村浩司》
プログラミング言語JuliaとPythonの比較《講師:岡村浩司》
これまで多くのプログラミング言語が開発されていますが、最近登場した言語はどのようなものか、科学技術計算向けの汎用プログラミング言語Juliaに触れてみたいと思います。Pythonとかなり類似した書き方なので習得は容易ですが、やはり微妙な違いが多いので注意が必要です。動的型付けですが、オブジェクト指向ではないという点には驚かされます。この動画はNCCHD第98回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
NumPy入門 1: NumPy配列を作る《講師:岡村浩司》
NumPy入門 1: NumPy配列を作る《講師:岡村浩司》
機械学習を行う上でなくてはならないNumPyと呼ばれるPythonの拡張モジュールがあります。なぜこのNumPyが使われているのか、その利点を理解していますか。データフレームとして扱うpandasに頼り、NumPyを扱うことができない方も多いようです。pandasに備わる豊富なメソッドに満足し、プログラミングの基礎がおろそかになっている方も見受けられます。NumPyが何かを知るために、まずはいろいろなNumPy配列を作ってみたいと思います。この動画はNCCHD第155回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
NumPy入門 2: NumPy配列にアクセスする《講師:岡村浩司》
NumPy入門 2: NumPy配列にアクセスする《講師:岡村浩司》
データをデータフレームとして扱うpandasに頼り、プログラミングの基礎をおろそかにしている方が見受けられます。機械学習に不可欠となっているPythonの拡張モジュールNumPyを扱うことができない方も多いようです。基礎的な操作に絞り、前回はNumPy配列を作ることを説明しましたが、今回はそのデータにアクセスしてみます。この動画はNCCHD第162回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
NumPy入門 3: NumPy配列の要素のデータ型を理解する《講師:岡村浩司》
NumPy入門 3: NumPy配列の要素のデータ型を理解する《講師:岡村浩司》
動的型付け言語とされるPythonに対し、NumPyはその点がややPythonと異なります。それこそがNumPyの利点であり、初心者にとって分かりにくい点かもしれません。NumPy配列を作り、アクセスできるようになったので、次は要素のデータ型について理解してみたいと思います。半精度浮動小数点数はディープラーニングで広く使われています。この動画はNCCHD第170回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
NumPy入門 4 (最終回)ブロードキャストなどを理解する《講師:岡村浩司》
NumPy入門 4 (最終回)ブロードキャストなどを理解する《講師:岡村浩司》
Pythonによる機械学習においてなくてはならないNumPy、これまでNumPy配列を作り、アクセスする方法を説明してきました。最終回はNumPy配列にスカラを足す場合などに自動的に行われているブロードキャストについて理解し、少し難しいですが、次元を増やしたり移動したりする方法を試してみます。また補足として、CuPyやPyTorchのTensorなどについても紹介します。この動画はNCCHD第187回データサイエンス研修にて発表された内容を再収録したものです。本コンテンツに関する問い合わせは、6NC共通教育講座中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
配布パッケージを作成してPyPIにアップロードして公開《講師:岡村浩司》
配布パッケージを作成してPyPIにアップロードして公開《講師:岡村浩司》
Pythonの高い有用性は標準ライブラリに加え、サードパーティから提供されるさまざまなパッケージによりもたらされていると言えます。コマンドpipやcondaを用いて設定する機会は少なくないでしょう。ここではPythonで独自モジュールを作成し、パッケージにしてPyPIに登録、そして一般公開する方法を紹介します。この動画は第199回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
Windows 10でLinux環境の構築 イロハのイ《講師:伊藤愛主》
Windows 10でLinux環境の構築 イロハのイ《講師:伊藤愛主》
Bash on Ubuntu on Windows (WSL1)を起動してWindowsでLinuxを使える状況を作りましょう! これで、WindowsがLinuxマシンに早変わりです。開発環境としてメジャーなLinuxでオープンソースソフトウェア(OSS)の世界を体験してみましょう。この動画はNCCHD第73回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
WSL2でLinux環境の構築《講師:伊藤愛主》
WSL2でLinux環境の構築《講師:伊藤愛主》
「Windows 10でLinux環境の構築 イロハのイ」の続編です。WSL2がリリースされたので導入についてのご紹介です。基本的にはWSL1と変わりませんが、完全なLinuxカーネルとして生まれ変わったWSL2がメジャーになると思うので、導入して損はないです。画像出力の環境変数の設定に注意! この動画はNCCHD第104回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
DockerとRでMariaDBを使う《講師:坂本美佳》
DockerとRでMariaDBを使う《講師:坂本美佳》
MariaDBで構築されたデータベースを、Dockerで作成した仮想環境に複製する方法を解説します。さらに、RのMySQLドライバを使ってデータベースから必要なデータを取り出し、ggplotで各種グラフを作成するデモンストレーションを行ないます。この動画はNCCHD第135回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
Linuxの実行可能ファイルを作って動かしてDockerを理解する《講師:岡村浩司》
Linuxの実行可能ファイルを作って動かしてDockerを理解する《講師:岡村浩司》
PerlやR、そしてPythonのようなスクリプト言語では、CPUやOSに依存した開発環境の違いを意識できません。最近ではコンテナ仮想化と呼ばれる技術が広く使われるようになってきましたが、どういった状況で活用できるのでしょう。ここではLinuxの実行可能ファイルを作り、DockerがLinuxに限らずmacOSやWindowsで何をしてくれるのかを理解します。この動画はNCCHD第140回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
Python CGIのコンテナを作って学ぶDocker入門《柴田眞侑》
Python CGIのコンテナを作って学ぶDocker入門《柴田眞侑》
Dockerコンテナは近年のアプリケーション開発を理解する上で重要なキーワードです。本動画は、Dockerやコンテナの説明に始まり、ごく単純なPython CGIコンテナ作成の実例を通して、コンテナ作成や共有の基本を満遍なく解説します。本動画を視聴し、Dockerやコンテナの全体像を掴んでいただければ幸いです。この動画はNCCHD第176回データサイエンス研修にて発表された内容を再収録したものです。本コンテンツに関する問い合わせは、6NC共通教育講座中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
Amazon EC2上にWordPressで構築したWebsiteを移植する際のTips《講師:青砥早希》
Amazon EC2上にWordPressで構築したWebsiteを移植する際のTips《講師:青砥早希》
Amazon EC2の利用方法の導入として、WordPressで作ったウェブサイトを運用する環境を例にサーバの構築方法を説明してます。EC2でのインスタンスの設定方法をメインに紹介しているので、ウェブサイトの運用だけではなく、解析環境の設定の際にも参考としてもらえるのではないかと思います。EC2超ビギナー向けです。この動画は第200回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
関係データベースにPythonからアクセス《講師:岡村浩司》
関係データベースにPythonからアクセス《講師:岡村浩司》
関係データベース、またはリレーショナルデータベースとはどんなものでしょう。ここでは遺伝子のデータを使ってMariaDBサーバでデータベースを作って、スプレッドシートなどとの違いを体験してみます。さらにPythonのコネクタを利用して、Pythonスクリプトからそのデータベースにアクセスしたり、編集したりする方法を紹介します。この動画はNCCHD第100回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
Windows Sybsystem for Linux (WSL)を設定してMariaDBクライアントを使ってみた《講師:塚本元子》
Windows Sybsystem for Linux (WSL)を設定してMariaDBクライアントを使ってみた《講師:塚本元子》
Windows 10 PCにUbuntuアプリとMariaDBをインストールして環境を構築。既に設定済みのデータベースに、データのアップロードとエクスポートをした体験をお伝えします。LinuxのデータをExcelに変換する方法や、HeidiSQLの使用例も紹介します。この動画はNCCHD第194回データサイエンス研修にて発表された内容を再収録したものです。本コンテンツに関する問い合わせは、6NC共通教育講座中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
データベース運用の一例-speedtestの反省を踏まえて-《講師:松原圭子》
データベース運用の一例-speedtestの反省を踏まえて-《講師:松原圭子》
MariaDBを使用したデータベース運用とデータ視覚化を体験してみました。NCCHD内のあちらこちらで測定されたWi-Fi速度を題材にしています。データベースの立ち上げ、ユーザ権限、入力、バックアップ、出力など、初心者が試行錯誤した経験を動画で共有しつつ、色々なユーザが気軽に安全に使用できるデータベース運用について考えました。この動画はNCCHD第137回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
HTMLの構造をオブジェクトとして扱うJavaScriptのDOMの理解《講師:岡村浩司》
HTMLの構造をオブジェクトとして扱うJavaScriptのDOMの理解《講師:岡村浩司》
ウェブページを動的に制御するプログラミング言語JavaScriptは、ウェブサービスを提供する上で欠かせない存在となっています。比較的分かり易いと言われる一方、基本的なことを知らずに迷走を続けるプログラマも多いようです。その中でもオブジェクトを介してウェブページを操作するDOMの理解は必須と思われ、今回はDOMについて解説しておきたいと思います。この動画は第224回データサイエンス研修にて発表された内容を再収録したものです。本コンテンツに関するお問い合わせは、6NC共通教育講座中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
PythonとSQLAlchemyでデータベースを操作《講師:岡村浩司》
PythonとSQLAlchemyでデータベースを操作《講師:岡村浩司》
データベースを操作する場合、一般にはSQLが用いられますが、Pythonのコネクタを介して処理を行う場合、それぞれのデータベースに対応した書き方が必要となります。SQLAlchemyはこれを回避するORMという便利な機能を持っていて、今は必要と思っていなくても、いずれ役に立つ可能性が大きいので、一度、基本的なことを試してみましょう。この動画は第210回データサイエンス研修にて発表された内容を再収録したものです。本コンテンツに関する問い合わせは、6NC共通教育講座中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
Spreadsheetでデータ共有する心構え《講師:松原圭子》
Spreadsheetでデータ共有する心構え《講師:松原圭子》
スプレッドシートを使ったデータをプロジェクトメンバ間で共有する時におさえておくべきルールについて解説します。「一度決めた名付けルールを守る」「ファイル名に‘final’をつけない」「rawデータを読み取り専用ファイルで保存する」といった基本的なルールから、データ分析や視覚化しやすいフォーマットについても解説します。この動画はNCCHD第92回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
データの前処理とヒストグラムについて-入門編-《講師:塚本元子》
データの前処理とヒストグラムについて-入門編-《講師:塚本元子》
データの前処理の重要性について、単位を揃える、データの型をそろえる、欠損値を埋めるの3つの実例で説明します。最後にPythonでヒストグラムを描出して、外れ値を確認したり分析にも活用できることを示します。この動画はNCCHD第120回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
OpenPyXlとpandasでExcelスプレッドシート《講師:岡村浩司》
OpenPyXlとpandasでExcelスプレッドシート《講師:岡村浩司》
プロプラエタリなMicrosoft Excelの代替ソフトウェアはいくつも揃っていますが、ここではPythonとOpenPyXlとpandasでExcelファイルを作り、読み、書き換えることことを試してみます。スクリプトを使うがゆえに、それらは自動的に、より正確に多量に高速に処理することができます。OpenPyXlで書式を維持したまま書き換えることもでき、驚くほどファイルサイズを小さくすることもできます。この動画はNCCHD第131回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
プログラミングにおける共通のデータ記述形式JSON《講師:岡村浩司》
プログラミングにおける共通のデータ記述形式JSON《講師:岡村浩司》
JavaScriptのオブジェクト記法を元にしたデータ記述形式であるJSONはさまざまなプログラミング言語で広く使われるようになった軽量のデータ交換用フォーマットです。ウェブ関連の技術でも多用されてます。Pythonのリストと辞書を駆使している方ならば、JSONの扱いは容易です。他人とのデータ交換にも、将来の自分へのデータとしても利用可能なJSONの概要を紹介します。この動画はNCCHD第123回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
データサイエンスにおけるラスタ画像の扱い《講師:岡村浩司》
データサイエンスにおけるラスタ画像の扱い《講師:岡村浩司》
近年のディープラーニングによる画像認識で扱われる画像はラスタ画像と呼ばれるデータです。ベクタ画像との違い、RGBなどのカラーモデルについて紹介し、データサイエンスで扱うことになる行列に変換してみます。また、JSONに書かれているクロップ情報から画像の一部を切り出したり、KerasのImageDataGeneratorによるデータ拡張も試してみます。この動画はNCCHD第94回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
OpenSlideを使ってPythonで病理画像を扱う《講師:佐藤楓果》
OpenSlideを使ってPythonで病理画像を扱う《講師:佐藤楓果》
病理画像をPythonで扱いたいときに便利なOpenSlideというライブラリについてご紹介します。病理画像のフォーマットはさまざまですが、OpenSlideは多くのフォーマットに対応しています。また、大きな画像を扱ったり、標本拡大時の解像度を再現したりすることができるという利点があります。ここではGoogle Colab上でのOpenSlideの使用例を、実際に病理画像を使って示します。この動画はNCCHD第160回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
pandasでデータフレームを整えてみる-エクセルに頼らない強い心を持つ-《講師:松原圭子》
pandasでデータフレームを整えてみる-エクセルに頼らない強い心を持つ-《講師:松原圭子》
データの本格的な解析前に行う「前処理」や「全体的に俯瞰する作業」ではどのようなアプリケーションを使っていますか? Excelは便利なツールですが、意図しない表示形式が自動適応され後で困ることもあるかもしれません。ここでは、Pythonのデータ解析ライブラリであるPandasを使ってデータを整える練習をしてみました。この動画はNCCHD第74回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
Rで表形式データを扱ってみる《講師:坂本美佳》
Rで表形式データを扱ってみる《講師:坂本美佳》
Rで表形式のデータを扱う方法のうち「データの読み込み」に着目し、コンマやタブなど区切り文字の違いや読み込む時の「データ型」で気を付けなくてはならないポイントを解説します。例として、ゲノム配列のアノテーションで使われるGFF形式のファイル読み込みを紹介します。この動画はNCCHD第77回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
Bash入門-Bashの正体から基本構文を用いた応用例まで-《講師:柴田眞侑》
Bash入門-Bashの正体から基本構文を用いた応用例まで-《講師:柴田眞侑》
Bashとは?から始め、bashスクリプトの基本ルール、構文(繰り返し処理、条件分岐処理)、特殊文字とそれらを活用したbashスクリプトの例を、Pythonとの比較をしながら紹介します。この動画はNCCHD第146回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
シェルスクリプトを使った簡単なバッチ処理の実行《講師:青砥早希》
シェルスクリプトを使った簡単なバッチ処理の実行《講師:青砥早希》
他の言語と並行してシェルスクリプトを学ぶ必要性がわからない、という声を聞くことがあります。この回ではシェルスクリプトの利用方法の一つとしてバッチ処理を紹介します。バッチ処理は大量の解析をする予定の方には必須の技術でありながら、スクリプトの作成も実行も簡単なのでたまにしかコマンドを扱わない方にもおすすめです。この動画はNCCHD第150回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
問い合わせ対応ChatBotを開発してみた《講師:塚本元子》
問い合わせ対応ChatBotを開発してみた《講師:塚本元子》
ChatBotとは何か、概要と開発手法を調べました。問い合わせ対応のChatBotを試作することになり、置き場所はMicrosoft 365のTeams上としました。Microsoft Power Virtual Agentsを用いてマニュアルを読み込ませ、選択肢型のChatBotを動かすことができました。開発の手順と、他の実用化されているChatBotの例を紹介します。この動画はNCCHD第151回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
川崎病の初期治療(IVIg)への不応症例を予測する機械学習モデルの作成《講師:布施田泰之》
川崎病の初期治療(IVIg)への不応症例を予測する機械学習モデルの作成《講師:布施田泰之》
機械学習が日常の臨床に生かすことができるかを検証するために、小児科医としてプログラミング(Python)と機械学習を数ヶ月で学びました。プログラミング初学者が「川崎病の治療不応性を予測する機械学習モデル」を試作する中で、学んだことや気づいたことを共有いたします。この動画はNCCHD第96回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
勾配ブースティング決定木フレームワークLightGBMの使用法《講師:岡村浩司》
勾配ブースティング決定木フレームワークLightGBMの使用法《講師:岡村浩司》
教師あり機械学習の決定木、そのアルゴリズムを理解することは難しいのですが、公開されているフレームワークを使えば非力なパソコンでも容易に実行することができるLightGBMを紹介します。データサイエンス研修から公開している顔写真データで、どの程度の認識精度なのか、分類に寄与する特徴量を抽出できるのか、多クラス分類や回帰にも使えるのかなど、試してみます。この動画はNCCHD第72回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
学習済み畳み込みニューラルネットワークによる画像認識《講師:岡村浩司》
学習済み畳み込みニューラルネットワークによる画像認識《講師:岡村浩司》
画像認識において高い認識精度を示す畳み込みニューラルネットワークの多くは、ビッグデータを利用した学習を経たデータとともに公開されています。しかもそれらは、機械学習フレームワークを利用することで、Pythonの初歩的なプログラミングにより動かすことができます。今回、自分で撮影した写真を投げ、どのように認識されるのか試すことで、フレームワークの使い方を説明します。この動画はNCCHD第169回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
PyTorchをベースに開発されたYOLOv7による物体検出《岡村浩司》
PyTorchをベースに開発されたYOLOv7による物体検出《岡村浩司》
ディープラーニングによる画像認識は、画像分類、物体検出、セマンティックセグメンテーションに分けられます。その中でも物体検出は、画像の中に写っている物を見つけ、バウンディングボックスと呼ばれる矩形で領域を明示します。今回、独自に撮影してラベルを付けたデータを用い、YOLOv7による訓練と検証、そして検出を実演し、その手順を紹介します。この動画は第179回データサイエンス研修にて発表された内容を再収録したものです。本コンテンツに関する問い合わせは、6NC共通教育講座中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
JavaScriptで出力する論文リストのウェブサイトをサーバレスで公開《講師:岡村浩司》
JavaScriptで出力する論文リストのウェブサイトをサーバレスで公開《講師:岡村浩司》
文献情報の形式などの整理に悩まされている研究者は多いと思います。NCBIのE-Utilitiesとして用意されているAPIを利用すると、文献番号で容易に情報を取得することができます。文献の数だけ取得したXML形式のデータをPythonとJavaScriptで処理し、ウェブページにし、従来のモノシリックなサーバからではなく、サーバレスコンピューティングで公開する方法を試してみたいと思います。この動画は第240回データサイエンス研修にて発表された内容を再収録したものです。本コンテンツに関するお問い合わせは、6NC共通教育講座中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
セキュリティと暗号化の基礎《講師:丘逸宏》
セキュリティと暗号化の基礎《講師:丘逸宏》
今やリモートワークやリモート学習は一般的になり、いつでも誰でも気軽に情報を共有できる時代になりました。新しい技術に触れ、それを学ぶ機会はたくさんありますが、その安全性を支えるセキュリティーについて学ぶ機会は少ないと思います。この回ではmacOSやWindowsでパソコンを始めたばかりの方や、ファイアウォールのように聞いたことはあるけど詳しくは説明できない方向けに浅く広く理解できるようセキュリティーを紹介します。この動画はNCCHD第129回データサイエンス研修にて発表された内容を再収録したものです。本コンテンツに関する問い合わせは、6NC共通教育講座中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
ハッシュ関数とハッシュ値および暗号学的ハッシュ関数《講師:岡村浩司》
ハッシュ関数とハッシュ値および暗号学的ハッシュ関数《講師:岡村浩司》
データを扱っているとハッシュという言葉をよく耳にします。MD5の値を計算したことがある方も多いかと思います。最近ではSHA-2によるハッシュ値が使われるようになり、ブロックチェーンでは不可欠な技術となっています。ハッシュ関数、ハッシュ値、そして暗号学的ハッシュ関数についてまとめ、その役割と重要性を理解したいと思います。この動画は第154回デNCCHDデータサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
解読不可能なワンタイムパッドのPython実装と暗号理論の基礎の理解《講師:岡村浩司》
解読不可能なワンタイムパッドのPython実装と暗号理論の基礎の理解《講師:岡村浩司》
排他的論理和を利用して解読不可能な暗号を作ることができるワンタイムパッド(OTP)という仕組みがあります。それを簡単なPythonスクリプトで実装してみます。OTPは量子暗号において重要な技術要素になっているのですが、実際にはほとんど使われていません。なぜ使われていないのかも考えながら暗号基盤の現状の理解も試みたいと思います。この動画は第213回データサイエンス研修にて発表された内容を再収録したものです。本コンテンツに関するお問い合わせは、6NC共通教育講座中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
公開鍵暗号RSAの中に潜む2つの素数《講師:岡村浩司》
公開鍵暗号RSAの中に潜む2つの素数《講師:岡村浩司》
世の中で使われている暗号アルゴリズムよりも、独自に考案した秘密のアルゴリズムの方が安全と思っていませんか。閉域網でないインターネットに、クレジットカードなどの秘密情報を流しても問題が起きないのはどういった仕組みが採用されているからなのでしょうか。公開鍵暗号、その中でも2つの素数の積を利用するRSA暗号についてその鍵の中身を覗いてみたいと思います。この動画はNCCHD第158回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
SSHポートフォワーディングの利用《講師:岡村浩司》
SSHポートフォワーディングの利用《講師:岡村浩司》
ネットワークに接続されているほとんどのコンピュータはTCP/IPにより通信を行なっています。そのクライアントサーバモデル、ホストとか、ポートとか、さらにLANやWAN、ファイアウォール辺りはしっかり理解しておきたいです。ローカルおよびリモートのポートを開放するコマンドsshのオプション-Lおよび-Rを使ってネットワークをまたいだ通信を試してみます。この動画はNCCHD第79回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
BSDソケットを利用したサーバプログラム作成《講師:岡村浩司》
BSDソケットを利用したサーバプログラム作成《講師:岡村浩司》
現在の気温を取得するコマンドをサーバプログラムとともにPythonで作り、クライアントサーバモデル、コマンドオプションやコマンド引数の処理、Pythonのdocstring、BSDソケットによるプロセス間通信、ウェブAPIの利用、ファイアウォールでサービスを追加しTCPポートを開放、指定したホストのTCPポートの状態確認、systemdによるサービスの管理、などなどを試してみます。この動画はNCCHD第88回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(<a href="mailto:6nc-educ.jimu@jh.ncgm.go.jp">6nc-educ.jimu@jh.ncgm.go.jp</a>)までご連絡ください。
-
LAMP構築したRaspberry Piを無線ルータにしてウェブアプリ公開《講師:岡村浩司》
LAMP構築したRaspberry Piを無線ルータにしてウェブアプリ公開《講師:岡村浩司》
このコロナ禍、毎日体温を測らなければなりません。自分のスマートフォンで体温を入力するとこれまでの変化が表示されるウェブアプリを自作してみます。小さくて安価なコンピュータRaspberry Piに、Linux、Apache、MariaDB、Pythonのインストール、つまりLAMP構築、さらに無線ルータにして、PHPやJavaScriptも使ってみます。この動画はNCCHD第102回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
人感センサの電子工作とクラウド利用でIoT開発《講師:岡村浩司》
人感センサの電子工作とクラウド利用でIoT開発《講師:岡村浩司》
IoTはセンサやアクチュエータなどが接続された比較的小さい機器がIPアドレスを持ってインターネットに接続され、サーバなどとデータのやり取りを行って何らかの目的を果たします。ここでは、人感センサを使った簡単な電子工作で、お手洗いの使用状況を手元のスマートフォンから確認できる仕組みを作り、IoT開発を体験してみます。この動画はNCCHD第109回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
Raspberry Piを用いたPython CGI《講師:柴田眞侑》
Raspberry Piを用いたPython CGI《講師:柴田眞侑》
開発したデータ解析ツールを幅広い人に活用したもらうためにはCGI構築が重要な一手となります。ここでは、Raspberry Piを利用した学習済み機械学習モデルのPython CGIの作成過程を、CGI構築初学者が順を追って紹介します。ただ成功例を示すにとどまらず、構築過程ではまってしまった落とし穴についてもまとめています。この動画はNCCHD第116回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
ウェブアプリケーションフレームワークFlaskの使い方 前編《講師:岡村浩司》
ウェブアプリケーションフレームワークFlaskの使い方 前編《講師:岡村浩司》
最近ではブラウザで動作するウェブアプリケーションが多く見られます。これらは従来のパソコンにインストールするようなソフトウェアとは異なり、クライアント側のOSなどを選ばないなど多くの利点があります。今回、Flaskを利用し、ブラウザ側から入力された情報をサーバ側のアプリケーションで処理して、結果をブラウザ側に返す単純なプログラムを作ってみます。この動画はNCCHD第196回データサイエンス研修にて発表された内容を再収録したものです。本コンテンツに関する問い合わせは、6NC共通教育講座中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
各種ソートアルゴリズムのPython実装《講師:青砥早希》
各種ソートアルゴリズムのPython実装《講師:青砥早希》
生命科学分野では解析時、生命科学計算パッケージを利用することが多いのではないでしょうか。パッケージに頼りすぎると内部でどのように計算が行われているのかを無視しがちです。ここではコンピュータの中で値がどのように扱われているのか、どのような処理ならコンピュータは得意なのかを理解することを目的としてソートアルゴリズムを勉強します。この動画はNCCHD第75回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
日本語のための文字コードとUnicodeのUTF-8《講師:岡村浩司》
日本語のための文字コードとUnicodeのUTF-8《講師:岡村浩司》
Unicodeの普及により、最近は文字化けをあまり見かけなくなりました。かつてはJISコード、日本語EUC、シフトJISなどの日本語コードが存在していましたが、現在ではUnicodeの中でも、多くの日本語文字が3バイトで表されるUTF-8と呼ばれる文字符号化形式の利用が一般的です。その他、UTF-16やUTF-32などもあり、それらとの違いや、バイト順マークBOMなどについても解説します。この動画はNCCHD第149回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
TeX LiveでTeXおよびLaTeXによる文書作成《講師:岡村浩司》
TeX LiveでTeXおよびLaTeXによる文書作成《講師:岡村浩司》
ワープロソフト、表計算ソフト、プレゼンテーションソフトだけが文書作成ツールではありません。むしろTeXやLaTeXの方こそ文書作成ソフトウェアです。どのOSでも無償で、軽快なテキストエディタで扱うことができ、数式をきれいに、論理構成に基づいて体裁が整うTeXを使ってみます。この動画はNCCHD第144回データサイエンス研修にて発表された内容を再収録したものです。本コンテンツに関する問い合わせは、6NC共通教育講座中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
ページ記述言語PostScriptの紹介《講師:青砥早希》
ページ記述言語PostScriptの紹介《講師:青砥早希》
描画スクリプト第一弾。ポストスクリプトはプリンターのための言語として汎用的に利用されていますが、実際にコードする人はかなり少ないちょっと特殊な言語です。ペーパーレスの時代に紹介するには古い言語ですが、可読性があり画像から数値データを取り出すことができるので研究や論文執筆と相性の良い言語です。この動画はNCCHD第161回データサイエンス研修にて発表された内容を再収録したものです。コンテンツの問い合わせは、中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。
-
SVGでニューラルネットワークを描画《岡村浩司》
SVGでニューラルネットワークを描画《岡村浩司》
ニューラルネットワークを描画してディープラーニングの説明をしたいことがあります。ポインティングデバイスを使う描画ソフトウェアでは、線が交わる箇所などが微妙にずれたり、ノードの配置にバランスが取れていなかったり。厳密に描画の場所を指定できるベクタ形式のSVGを利用し、この問題に対応してみます。この動画は第177回データサイエンス研修にて発表された内容を再収録したものです。本コンテンツに関する問い合わせは、6NC共通教育講座中央事務局(6nc-educ.jimu@jh.ncgm.go.jp)までご連絡ください。