システム性能の最適化を 支援するツールです図1 隠れマルコフモデルを用いたたんぱく質の相同性検索処理(hmmer)の解析結果実用化イメージ、想定される用途・大規模なHPC(High Performance Computing:高性能コンピューティング)アプリケーション開発・大規模な多次元配列を計算する典型的な科学計算アプリケーション企業等への提案様々な角度から、プログラミング、コンピューティングの技術・科学・アートを探求し、実践していく研究を行っております。この技術にご興味をお持ちの企業の技術相談をお受けします。また共同研究等のご検討の際にはご連絡ください。情報・知能工学系 計算機システム性能工学研究室http://www.perf.cs.tut.ac.jp/とチューニング結果例図2 キャッシュレイン競合検出、原因箇所特定 研究者情報:https://researchmap.jp/yukinori_sato概要コンピュータシステムの理論限界性能と実際に達成できたソフトウェア実行性能との差を分析し、モデル化や数理最適化技術を駆使し、アプリケーション特化型の高位最適化技術として展開することを研究しています。大規模なプログラムのシステム性能の最適化における生産性向上を目指すツールとして、pMarker法やキャッシュライン競合シミュレータC2Sim(Cache-line conflict simulator)を開発しました。従来技術・性能チューニングや最適化には、ループ構造の理解が必須で多くの労力が必要です。・発生した競合の数を返すのみで、競合箇所と発生原因を見つける必要があります。特徴【pMarker法によるL-CCT(Loop-Call Context Tree)の抽出】・正確なループ構造をコード実行時にバイナリ計装技術を使って抽出できます。・L-CCT(Loop-Call Context Tree)を使って実際のプログラム実行で現れたループネストと関数呼び出し関係を表現できます。加えて、動的なデータ依存関係も検出し、LCCT+Mグラフとして表示することができます(図1)。⇒プログラマやコンパイラにプログラムコード実行時の透過的並列性抽出やコード実行特性の理解の支援が可能です。実用化に向けた課題・pMarker法をLCCTグラフの可視化以外に、機械学習と組み合わせプログラムの自動最適化/並列化に応用すること・C2Simを完全自動チューニングシステムの拡張、新しいコード変換機構の開発優位性・ループネスト構造とその実行時の重みを正確に示し、コード実行特性の理解を支援。・キャッシュラインの競合箇所と発生原因を効果的に検出でき、性能チューニングの半自動化を実現。【C2Simの特徴】・キャッシュライン競合をその発生の正確な検出、原因箇所の特定、及び、チューニング戦略の提示します。・FA(fully-associative)キャッシュとSA(set-associative)キャッシュを同時にシミュレーションし、競合を検出し、どこでなぜ競合が発生したのかを特定できます。⇒チューニングするべき箇所を特定して性能向上できることを実証しました(図2)。キーワードソフトウェア実行性能解析、プロファイリング、性能モデル、性能推定、 L-CCT(Loop-Call Context Tree) 、C2Sim−072−研究段階基礎実証実用化準備情報・通信システムレベルでの性能品質の科学的モデリングの研究情報・知能工学系佐藤 幸紀 准教授
元のページ ../index.html#81