CPUコアを切り離してインターコネクトの問題とプロセスのばらつきの影響を限定すると、これら全てのトランジスタの最適な使用法という問題に戻ることができます。その答えはアプリケーションによって異なります。しかし、さまざまな種類の処理ユニットを共有キャッシュ周辺のクラスタに含む、ヘテロジニアスマルチコア処理に向かうアーキテクトが増えています。

　最も顕著な例は、高性能コアと低消費電力コアを組み合わせてキャッシュの周辺に集めたARMの「big.LITTLE」コンセプトでしょう。2つのタイプのコア、例えば大きなCortex R-A15と小さなCortex-A7は命令セットが同じでステートレジスタも似ているため、高速化と省エネのどちらを優先するかによってタスクをそれらの間で容易に移動することができます。

　このコンセプトは、コアの種類が違っていてもサイズが違っていても有効です。ARMのCTOであるMikeMuller（マイク・ミュラー）氏は、1つの命令セットを共有するCPUとグラフィック処理ユニット（GPU）の両方を含むヘテロジニアス構成について、2014年のHotChipで謎めいた言及を行いました。AMD、IBM、インテル、Microsoftなど、多くの会社がGPUまたはFGPAをCPUと密結合させるアーキテクチャに取り組んでいることはさらに明らかです。

　そのようなヘテロジニアス方式は、多くのスレッドを並列実行するのではなく、シングルスレッドの中に存在する機会を利用することによって機能します。GPUは、グラフィックスなどに代表される並列性が高いデータを利用するための大規模な単一命令／マルチデータ（SIMD）エンジンを提供します。FPGAは、並列もしくはパイプライン化されたデータパス、または命令フェッチをなくす単純なステートマシン駆動型ループを実装できます。

　インテル Xeon Phiのようなメニーコアアーキテクチャでは、データの並列性、またはタスクを極めて多くの軽量スレッドに分割する機能のいずれも利用できます。その結果、どのケースでも新規ハードウェア用に再コーディングしたスレッドが大幅に高速化され、場合によっては消費電力が削減されます。

プロセッサを超えて

　それでも、マルチコアクラスタを離れ、ダイを横切って進むことが必要な信号もあります。これらのパスのタイミングを収束させる従来の方法は、信号をバッファにロードして高位レイヤー（従って低インピーダンス）のトレースにルーティングするか、または諦めてマルチサイクルパスであると宣言するかでした。いずれの選択肢にも不利な点があります。

　しかし、静的電力をあまり増加させずに大量のゲートを利用することが可能な、その他の選択肢が現れます。

　1つの選択肢は、各セグメントの遅延が1クロックサイクル以内に収まるように信号をレジスタ（できれば、準安定を管理するためにクロッククロッシングレジスタ）に入れ、長いパスをパイプライン化することです。信号が電圧ドメイン間をわたるので、これにはレベルシフトが必要になる場合もあります。レジスタを挿入することによってリタイミングも可能になります。リタイミングは、幾つかのロジックを新しいドメインに複製する必要があるとしても、有用であり得ます。

　それより長い接続、とりわけパスの幅が広い場合は、GALS（Globally Asynchronous Locally Synchronous）ネットワークオンチップ（NoC）を使用するという、全く異なるアプローチがあります。

「SoCの機能ブロック分割」という潮流

サブシステムIPがチップの境界を越える
サブシステム規模のIP（サブシステムIP）はSoCはもちろん、FPGAにまでも影響を与えています。素晴らしい取り組みですが、さまざまな注意点も存在します。スムーズな実装を行うための4つの注意点について述べます。
畳み込みニューラルネットワークの使い方、分かりますか？
畳み込みニューラルネットワークとは何でしょうか。学問の世界から現実の世界に登場しつつあるこれは、さまざまな組み込みシステムに利用される可能性が高く、大いに関心を持つべきです。
組み込みにおけるコンピュータビジョンを整理する
画像認識（コンピュータビジョン、マシンビジョン）の需要は高まっており、その方法はさまざまです。画像による入力を有用なものとする実装方法について分類と整理を試みます。
モノのインターネットを再考する
IoTがその現実性について語られるようになった2015年、その基本概念を再考する機運が高まっています。「センサー」「仮想化」「フォグ」などの観点から、IoTを再考してみましょう。
コンピュータ・アーキテクトのためのモーター制御
「モーターを制御する」。一見すると簡単な課題に思えますが、その原理や課題、現状を再確認すると、リアルタイムシステムアーキテクチャの今後の方向性を示していることが分かります。