近年、ニューラルネットワークを用いて画像や文章を生成する生成系AI技術が急速に進歩しており、膨大な文書データを用いて訓練された対話型AIが登場してSociety 5.0への移行を加速しています。イエンス教育プログラムのWebページ(https://mds.chiba-u.jp)に公開されています。(1)データ・AI&都市環境システム‐システム快適化へのアプローチ (千葉大学大学院工学研究院 荒井幸代先生)(2)大規模宇宙シミュレーションと大規模データ (千葉大学統合情報センター 石山智明先生)(3)データサイエンスの活用による地球環境問題への挑戦 (千葉大学環境リモートセンシング研究センター 市井和仁先生)(4)千葉大学予防医学センターにおけるデータ活用事例 (千葉大学予防医学センター 江口哲史先生)(5)小地域推定とその応用 (千葉大学大学院社会科学研究院 川久保友超先生)5データと情報の関係計測器などを使って取得した数字や文字の羅列はデータです。データを処理することによって得られ、何かを判断するための材料になるものが情報です。JIS X 0001 (1994)によると、情報とは「事実,事象,事物,過程,着想などの対象物に関して知り得たことであって,概念を含み、一定の文脈中で特定の意味をもつもの」とされています。他方、データとは「情報の表現であって,伝達,解釈又は処理に適するように形式化され,再度情報として解釈できるもの」です。実験データや観測データを数理的に解析して知見を得ることは、データから情報を抽出していることに相当します。データの種類データには質的データと量的データがあります。質的データは分類や種別を区別するためのデータで、学生番号、国籍、血液型、職種など演算できないデータのことです。量的データは数値として意味があり、演算できるデータで、試験の点数、身長、体重、温度、速度、金額などが相当します。自分たちで集めたものを1次データ、そうでないデータを2次データと呼びます。構造化データと非構造化データという分類もあります。構造化データは表のように項目ごとに整理されたデータのことです。非構造化データには文章、画像・動画、音声・音楽などがあります。データサイエンスとAI膨大なデータを活用するための手法としてAI(Artificial Intelligence、人工知能)がトレンドになっています。人工知能と言っても新たな事態に対応できる汎用人工知能には程遠いものですが、将棋や囲碁、あるいは画像認識など特定の分野では人間を凌駕し、活用されています。最も成功しているのは脳神経細胞を数理的にモデル化したニューラルネットワークです。大量のデータを多層ニューラルネットワークに読み込ませて学習を行う深層学習(ディープラーニング)が、画像認識、異常検知、ロボット、言語翻訳などに適用されています。「データにもとづいて新たな知見を得る」ことが機械的な学習によって実現されつつあります。データサイエンスの活用例千葉大学の教員がデータサイエンスをどのように活用しているかを紹介する以下の動画が、千葉大学数理データサ
元のページ ../index.html#5