01返信、78%増。同じ現場で。
2025年11月1日、私たちのエージェンシーは、アウトバウンドのターゲットリストの作り手を切り替えた。リクルーターの人数は変えていない。送信の設定も変えていない。スカウトメールのエンジンも変えていない。変えたのは、ひとつだけ。誰がリストを作るか、である。手作業で作っていたリストを、Headhunt.AIが生成するリストに置き換えた。
6ヶ月後、運用データの結論ははっきりしている。
導入前: 345日(2024年11月21日〜2025年10月31日、人手で作成したリスト)。導入後: 181日(2025年11月1日〜2026年4月30日、Headhunt.AIのリスト)。526日、受信返信10,932件、ひとつの現場。
1日あたりの平均は、16.4件から29.1件に増えた。2026年第1四半期から週末の送信を止めたため、その影響を除いた平日平均で見ると、18.2件から35.8件。本データで最も厳密な同条件比較で、+97%である。
見出しの数字は、量だ。だが、現場で効いてくるのは分布のほうである。導入前は、月の数字を、ごく一部の突出した日で作っていた。ほとんどの日は、ほぼゼロ。導入後は、結果の出る日が例外ではなく常態になった ― このあとのヒートマップが、その変化を視覚化している。
同じ現場。同じ市場。同じエンジン。リストだけが違う。
02もっとも厳密な、同条件比較。
AIソーシングの導入事例で、いちばん多い反論がある。「変数が多すぎる」だ。ツールが変わり、文面が変わり、チームが変わり、市場が変わる。これでは、AIそのものの寄与が切り出せない。私たちの場合、その切替はめずらしいほど明確だった。何を固定し、何だけを変えたのか。以下のとおりである。
-
リクルーターの人数。
両期間とも、同じ。同じ現場、同じ役割。
-
スカウトメールのエンジン。
計測開始日から、Headhunt.AIの生成エンジンを使ってきた(導入は2024年8月1日)。
-
送信の設定。
導入前と同じスタック、同じ設定で動かしている。
-
顧客構成と市場。
日本国内のミドル市場、同じ職域(バイリンガル金融、IT、営業、コマーシャル、HR、マーケティング)。
動かしたのは、ひとつだけ ― 誰がリストを作るか。導入前は、リクルーターとリサーチャーが、手作業でリストを作っていた。LinkedIn Recruiter、ATS検索、手動ソーシングの組み合わせだ。導入後は、Headhunt.AIがリストを生成する。スカウトメールを書くエンジンは同じ。送信、返信対応、面談は私たちのチームが回している。
多くのAI事例は、一度に5つ変える。私たちは、ひとつだけ変えた。
03ブレの少ない、現場。
見出しの数字を見れば、平均が動いたことはわかる。だが、分布の形までは見えない。四半期ごとに売上を読むエージェンシーにとっては、見出しの数字より、返信分布の形のほうが重要だ。
ピークは、高くなった。谷は、ほぼ消えた。
04月次で見ても、転換点ははっきりしている。
総計の平均値は、その下で何が起きているかを覆い隠してしまうことがある。同じデータを、月単位で並べる。さらに、前年同月と比べる。
プラットフォーム史上の記録は、すべて導入後に塗り替えられた。
05入力側の何が、実際に変わったのか。
上に並べた数字は、目に見える結果だ。その裏で何が効いているかは、もう少し見えにくい。だが、立ち止まって考える価値はある。今回の伸びは、文面が良くなったから出たのではない。スカウトメールを書くエンジンは、導入前も導入後も同じだ。効いたのは、そもそも誰がターゲットリストに載るか、である。
-
ターゲット精度の向上が、数字で確認できる。
同じ職域カテゴリで、人手のリストとHeadhunt.AIのリストを、社内指標のESAI Scoreで比較した。Headhunt.AIのリストの平均スコアは、77%高い。リクルーターの仕事が雑だからではない。AIは、企業ティア、在籍年数のパターン、語学シグナル、キャリアの軌跡まで、案件要件のすべてで全候補者を評価する。400万件超のプロフィールを、人間が午前中で見切ることはできない。AIにはできる。
-
より広いリスト。人の検索では出ない候補者まで見つかる。
Headhunt.AIは、LinkedIn RecruiterやATSのキーワード検索では捉えきれない次元で候補者を引き上げる。キャリアの軌跡、隣接業界の経験、潜在的なスキルの兆し、企業ティアの間接的な証拠などだ。日本語と英語の両方を最初から扱うため、バイリンガル検索でキーワードが噛み合わず母集団が縮む、という構造的な偏りも生じない。
-
暗黙のフィルタが、どの言語でもかからない。
LinkedIn Recruiter、Bizreach、多くのATSは、リクルーターが入力したキーワードに対してプロフィールでの記述が薄い候補者を、結果から静かに沈めてしまう。本当はぴったりの人でも、別の言い回しを使っていたり、日本語のみで運用していたりすると、検索結果の上位には出てこない。Headhunt.AIは、すべてのプロフィールを案件要件に対して評価したうえで順位付けする。情報量の少ないプロフィールでも、キャリアの実態が合っていれば、ちゃんと浮上する。
-
止まらない、ムラのない処理能力。
AIに休暇はない。月曜の立ち上がりが鈍い、ということもない。リスト作成の3時間目に集中が切れる、ということもない。1日目と181日目で、同じ基準・同じ厳密さで候補者を評価し続ける。コストはAPIトークン代だけ。置き換えた人手のコストに比べれば、はるかに安い。
06リストの伸びが、返信の伸びに重なる理由。
リストが良くなれば、返信が増えるだけではない。返信そのものの質が変わり、後工程でも複利的に効いてくる。ファネルの各段階で重ねた小さな伸びは、最後に掛け算で積み上がる。
-
適合度の高い候補者は、メールを開く確率が高い。
候補者の現職に響く件名は届く。汎用的な件名は流される。スパム報告が減るため、メールでもLinkedInでも到達率が上がる。
-
適切なアウトリーチには、適切な返信が返ってくる。
送信エンジンも、送信者も、送信量も変えていない。それでも返信率は上がる。2026年第1四半期で+13.8%。
-
返信が増えれば、面談も増える。
面談化率はほぼ一定。返信の伸びは、そのまま面談数の伸びに移る。同じチームで、1人あたりの面談数+38%。
-
適合度の高い候補者は、面接通過率が高い。
本当に案件に合った人は、顧客側の面接でも残りやすい。面接通過率+13.5%。
-
オファーが決まる。受諾も増える。
本当に合っている候補者は、オファーを受ける確率が高い。オファー受諾率+14%。
ファネルで最も影響の大きい変数は、リストである。下流のすべては、その質を引き継ぐ。
07ファネル全段階で、運用が裏付ける。
返信率の伸びが上流だけの現象なら、顧客の面接プロセスに入った段階で消えるはずだ。オファーまでも残らない。成約数にも反映されない。これは、直接確認できる。返信テストを回したのと同じエージェンシーが、採用ファネルの全段階を計測しているからだ。同じ現場で、2026年第1四半期と2025年第1四半期を並べる。
ESAI Agencyの運用データ。2026年第1四半期(1〜3月、導入後)を、2025年第1四半期(1〜3月、人手リスト)と比較。同じ現場、同じ市場セグメント、同じ手数料体系。
これは机上の数字ではない。526日分の返信ログを処理した同じ現場が、そのまま面談を回し、面接後のすり合わせに同席し、オファーをクローズしている。上の各段階は、それぞれ独立した計測だ。だが下にある仕組みはひとつで、共通している。ターゲットの精度が上がったリストを、同じ後工程に流し込んだ。それだけのことである。
オファーまで生き残らない返信の伸びは、見栄えだけの数字だ。今回の伸びは、生き残った。
08そして、チームに1週間が戻ってきた。
見出しは、返信のデータだ。だが、エージェンシーの経営層が返信率よりも気にしているのは、別のところにある。リクルーターのキャパシティだ。リスト作成をAIが担えば、リクルーターは担わずに済む。
リクルーターの1週間のうち、20〜30%とは何か。リスト作成は、目立つ仕事ではない。だが、重い仕事である。1案件のソーシングだけで4〜6時間。boolean文字列を組み立て、LinkedIn Recruiterをスクロールし、過去のATSデータと突き合わせ、出力して重複を除く。担当案件分を合計すると、リクルーター1人あたり週1日〜1.5日に達する。AIなら、これを90秒で終える。
戻ってきた時間は、どこに流れるか。空いた時間は、どこかに消えるわけではない。ファネルの後ろの工程に流れていく。候補者面談、顧客との深いすり合わせ、リファレンスチェック、構造化されたクロージング対話などだ。リクルーター1人あたり+38%の面談増。半分は、返信率の上昇から来る。残り半分は、リスト作成から解放されて、面談に使える時間が増えたことから来る。
売上の観点で見ると、ここが一番効く。リクルーターの売上は、案件数ではなく労働時間に縛られている。その20〜30%が戻ることは、増員ゼロのままリクルーターを0.2〜0.3人増やしたのと同じである。
手作業ソーシングの最大のコストは、費やした時間ではない。その時間で取れなかった面談のほうである。
09懐疑派から聞こえてくる、声。
このデータを、同業エージェンシーの経営層、企業の採用責任者、競合のAIソーシングベンダーの実務担当者にも見せてきた。繰り返し出てくる反論が6つある。一つひとつに、はぐらかさず答える。
「導入後の期間には、別の運用変更が重なっている。週末の送信停止が入った。リスト切替の効果が、完全には切り分けられていないのではないか。」
もっともな指摘である。導入後の期間で動かしたほかの運用は、週末の送信停止だけだ。本書の方法論にも明記している。これは1日あたり平均の分母を変える(週末は送信日から外れる)。だが、平日平均には影響しない。だから本書で最も厳密な単一の数字は、週末停止の影響を取り除いた平日平均の+97%である。見出しの+78%は、両方の効果を合わせた数字。+97%が、最も厳密な同条件の読み方だ。
「6ヶ月では足りない。2年のデータを見せてくれ。」
より長い期間があるに越したことはない。だが、詳細な返信ログを取り始めたのが2024年11月。切替は2025年11月。手元にあるのは6ヶ月分だ。それでも、181日の運用日、5,275件の受信返信、1四半期分の完全なサイクル、2026年第1四半期の選考シーズンを含む。シグナルは、偶然のばらつきでは説明できないほど大きい。導入前の最良月(2025年3月、730件)が、導入後の平均月(879件)を下回っている。
「リクルーターが上達しただけだ。AIの効果ではない。」
この反論は、返信を生み出しているのがリクルーターである、という前提に立つ。だが、そうではない。Headhunt.AIが候補者検索、スカウトメール生成、送信までを担っている。返信数を作るループに、リクルーターは入っていない。リクルーターの経験値は、返信が返ってきた後の工程(面談準備、スクリーニング、案件の打ち出し)に効く。返信が返ってくるか否かには効かない。リクルーターの上達は本物だが、本書が計測しているのは、それとは別のファネル段階である。構造的に、最初から切り分けられている。
「Headhunt.AIは、LinkedInをスクレイピングしているだけだ。同じことは自社でもできる。」
データの主軸はLinkedInの公開データ。加えてX、GitHub、Facebook、Instagramのシグナルを使う。独自データベースを謳っているわけではない。独自なのは、400万件超の日本特化プロフィールを、案件ごとの具体要件で2分以内にスコアリングする仕組みのほうだ。理屈の上では再現できる。ただし、エンジニア2人、約18ヶ月、コンピュート費用で数十万ドル。それで、ようやく1本目の使えるリストが出るかどうかである。同じ2分で、私たちのシステムなら検索結果が手に入る。
「うちの市場は違う。それはお宅の現場のデータだろう。」
Headhunt.AIの対象は、日本国内の採用に限られている。だから「市場が違う」というのは、日本国内での業界や職域が違う、という意味になる。これまで計測してきたすべての業界・職種(テック、金融、営業、コマーシャル、HR、マーケティング、多言語ロール、エグゼクティブサーチ)で、同じパターンが出ている。マッチ精度が上がれば、返信は増える。仕組み — 400万件超の日本特化プロフィール母集団を、案件の要件で評価し、手作業のboolean検索を置き換える — は、業界に依存しない。絶対値はセグメントで変わるが、伸びる方向は変わらない。
「これが本当なら、なぜまだ全社がAIソーシングに乗り換えていないのか。」
理由は3つある。第一に、つい最近まで、候補者のスコアリングモデルは人手のリサーチに勝てなかった。その世代に賭けた早期導入者は、痛い目を見ている。第二に、人手を上回るモデル世代(GPT-4級以降)が、大量評価に実用化されたのは2024年だ。第三に、エージェンシーの経営層がこの種のツールを評価するときは、たいていデモで判断する。本番並列の比較検証ではない。デモでは、効果が過小評価される。市場は今、追いついている途中だ。問題は、自社が競合より先に追いつくか、後で追いつくか、である。
正しい判断の仕方は、議論ではない。自社の案件で、実際に試してみることだ。
10自社の現場で、検証する方法。
本書のすべての数字は、自社のリクルーターと案件に当てるまでは、ただの理屈にすぎない。調達プロセスも、システム連携も、ベンダー契約も必要ない。いちばんきれいな試し方を、ここに示す。
実在する自社案件1件に対して、ランク付け・スコア付けされた、日本国内の候補者500人。契約なし。設定なし。連携なし。
-
クレジットパック7万5,000円を購入する。
クレジットは500。サブスク契約も年間契約も不要。クレジットに期限はない。1クレジットで、指定した案件にマッチしたESAIスコア付きの候補者が1人返ってくる。
-
通常は手作業でソーシングする、自社の案件をひとつ選ぶ。
ミドル市場、成功報酬型、AIスコアリングが効きやすい職域(バイリンガル金融、IT、営業、コマーシャル、HR、マーケティング、など)。職務記述書を貼り付ける。Headhunt.AIは、400万件超の日本特化データベースから、ランク付けされた候補者を1〜2分以内に最大1,000人返す。
-
その職域を担当しているリクルーターに、リストを見せる。
問いはひとつ。「このリストの中に、通常のソーシングでは出てこなかった候補者はいるか?」答えがイエスなら、たとえ数名でも、Headhunt.AIは現行プロセスが見落としている候補者を見つけている、ということになる。自社のデータで、1時間以内に、概念実証は完了だ。
構造化した並列テストを回したい場合、計測テンプレートを追加料金なしで提供する。sales@executivesearch.aiまで。
11チーム内で問う価値のある、8つの質問。
最初に問うべきは「AIソーシングを導入すべきか」ではない。運用上の診断項目を、一通り当てることである。チェックの数を数えるための問いではない。実際の数字で答えられる項目と、ぼんやりとしか答えられない項目を切り分けるための問いだ。後者こそ、これからやるべき仕事の在りかである。
-
過去90日間の平日の受信返信平均を、推計ではなく実測で押さえているか。
-
候補者品質の十分位ごとの返信率を見ているか。それとも全体平均だけか。
-
リクルーターの1週間のうち、リスト作成と適合性判断に充てられている割合は何%か。30分のカレンダー監査で測ったうえで。多くのチームは40〜50%と答える。実測では60〜70%に着地する。
-
月次の高返信日の分布を把握しているか。それとも平均値だけか。
-
過去12ヶ月の、JD受領から初回ショートリスト提出までの平均日数はいくつか。上昇傾向なら、競合に対して負け始めている。
-
実在する案件で、同じリクルーターに両方を担当させて、AIソーシングツールと手作業ソーシングを並列比較したことがあるか。
-
同じ料金帯の競合エージェンシーが、明日リクルーター1人あたりの返信量が1.97倍になったと発表したとして、30日以内に取る具体的な対応は何か。
-
担当する各案件について、その案件にとっての適合候補者がどの企業ティアか、どの在籍年数パターンか、どの語学シグナルかを、具体的に答えられるリクルーターの割合は何%か。
7〜8項目を具体的に答えられる。AIソーシングを厳密に評価できる運用レベルにある。実在する1案件で、並列テストを回す段階だ。
5〜6項目。計測している領域は強い。分布の把握に空白が残る可能性。
3〜4項目。計測と勘の混在で運用している。ツール評価の前に、まず受信返信の分布を計測する仕組みを入れる。
0〜2項目。計測で動く競合に対して、勘で戦うことになる。内側から見える以上に差は開いている。
12率直に言って。
AIソーシングは本物だ、と判断したエージェンシーや事業会社の採用チームは、これからの18ヶ月で、運用上の習慣、計測の仕組み、候補者パイプラインの作り直しに取り組むことになる。AIソーシングはまだ早い、と判断したチームは、同じ18ヶ月を、現状のキャパシティで過ごす。競合は、同じ料金水準で1.5〜2倍のキャパシティで動いている。
本書の返信データは、予測ではない。自社の現場で、同じ人員が、同じ仕事をしながら、すでに起きた記録である。仕掛けに特殊なものは何もない。変えたのは、リストだけ。
伸びは、ただ大きいだけではない。安定している。日々のばらつきが減った。その安定こそが、売上ラインを計画として読める形に変えるものである。
本書のあとに続くものはすべて、ここから派生する。ESAI Scoreが77%上がったから、返信率が伸びた。返信率が伸びたから、面談数が伸びた。面談数が伸びたから、成約数が伸びた。成約数が伸びたから、構造的に縮小していく手数料プールのなかでも、利益率を改善できた。仕組みは平明で、算数も平明だ。残っているのは、自社の現場で試す、という一手だけである。
これらのシステムは、今日この瞬間が、これから先で最も性能の低い状態である。AIの進化は、線形ではない。今、投資して競合の先を行くか、後で追いつくか、である。
読むのは、気が重い。動くのは、もっと気が重い。「動かない」も、ひとつの判断である。ただし、現状維持に見えるぶん、実際よりも安全に感じやすい。それだけは、覚えておくべきだ。