自然言語処理

 

  • Allen Institute for AIの科学文献インデクサーSemantic Scholarにバイオメディカルの論文数千万点が加わる

    Allen Institute for AIの科学文献インデクサーSemantic Scholarにバイオメディカルの論文数千万点が加わる

    科学の文献を自然言語処理などのAIの技法を使ってインデクシングするプロジェクトSemantic Scholarが、これまでのコンピューター科学に加えて、バイオメディカル(biomedical, 生物医学)の研究文献数千万点を新たに加えた。これで、この、この有益なツールがカバーする分野がさらに増えたことになる。 続きを読む

  • AI
    Rasa Coreはチャットボットのコンテキスト判断用機械学習モデルを人間参加の半自動で作る

    Rasa Coreはチャットボットのコンテキスト判断用機械学習モデルを人間参加の半自動で作る

    会話を扱うコンピューターシステムにとっては、コンテキストがすべてだ。人間はそのことを意識しないけど、日常のとてもシンプルな会話でさえ、複雑なコンテキストの産物だ。会話システムが人間の能力になかなか追いつかないのも、コンテキストという難問があるためだ。しかしベルリンのRasaは、対話的な学習とオープンソースのコードを利用して、この会話するAIの問題を解決しようとしている。 続きを読む

  • Google CloudのNatural Language APIにタグ付けによるコンテンツ分類と物や場所(語)レベルの感情分析機能が登場

    Google CloudのNatural Language APIにタグ付けによるコンテンツ分類と物や場所(語)レベルの感情分析機能が登場

    Google Cloudが今朝(米国時間9/19)、そのNatural Language APIのアップデートを二つ発表した。具体的には、ユーザーがコンテンツの分類機能と対象物の感情分析機能にアクセスできるようになったことだ。この二つの機能は、ブランドやメディア企業でとくに重宝するだろう。 まず、GCPのユーザーはコンテンツにタグ付けできるようになる。タグは、健康、エンターテインメント、法律など、一般的な話題だ(cc: Henry)。今日のアップデートで、ドキュメントを700のカテゴリーに分類できるようになる。 続きを読む

  • AIが王様を収穫したりオレンジを解錠しないためには常識の装備が必要だ

    AIが王様を収穫したりオレンジを解錠しないためには常識の装備が必要だ

    ぼくがあなたにリンゴを手渡したら、あなたは自分の経験から、それが運転できるものではない、とわかるだろう。そして、それが採れた木で織物を織れないことや、その種(たね)でテニスはできないことも、わかるだろう。人間なら、それがナンセンスだと分かるが、でもAIには、現実世界で何年も過ごしたという優位性がない。だから、何で何ができる・できないという知識もない。彼らに常識を持たせることも、できないのだろうか。 続きを読む

  • TableauがClearGraphを買収、自然言語を使ってデータ分析が行えるようになる

    TableauがClearGraphを買収、自然言語を使ってデータ分析が行えるようになる

    ビジネスインテリジェンスと分析を提供するTableauは、本日(米国時間8月9日)ClearGraphの買収を発表した。ClearGraphは、自然言語によるクエリ(例えば「今週の500ドル以上の取引を取得」など)によって、膨大なビジネスデータのクエリとビジュアライズを行なうことのできるサービスだ。Tableauはこのテクノロジーを自社の製品に統合し、ユーザーたちがそうした自然言語による問い合わせを使ってデータのビジュアライズを簡単に行えるようにする予定だ。 ほとんどのエンタープライズ・データベースから情報を引き出すためには、通常SQL… 続きを読む

  • Google Analyticsに音声(+自然言語)で質問できるようになる…まず英語から

    Google Analyticsに音声(+自然言語)で質問できるようになる…まず英語から

    自分のWebサイトやアプリの利用状況を知りたくなったら、これからはGoogle Analyticsに直接尋ねることができる。 “先週はモバイルとデスクトップでどれだけトラフィックが違ったかな?”とか、“昨日の新規ユーザーは何名だっただろう?”、“先週はどこの国の人がいちばん多かったか?”、などなどを知りたくなったら、これまでのようにAnalyticsのダッシュボードを開いてチャートを操作しなくてもよい。 単純に、クェリをタイプしたり、大きな声で言うだけでよいのだ。… 続きを読む

  • 一般庶民の日常的法律問題を助けるDoNotPayの訴訟書式チャットボットがついに1000種を超えた

    一般庶民の日常的法律問題を助けるDoNotPayの訴訟書式チャットボットがついに1000種を超えた

    自作のチャットボットDoNotPayが駐車券争いで役に立ち、一躍話題になった19歳のJoshua Browderはそれ以来、できるだけ多くの、よくある法律的ニーズをできるかぎり自動化して、司法を民主化したいという彼のクェストに、さらに没頭を続けた。その結果Browderは、アメリカのすべての州とイギリスで、これから訴訟を起こす人びとの訴訟文書の作成を助ける、およそ1000種あまりのボットを作ってしまった。 続きを読む

  • Facebook本社で犬種判別人工知能に挑戦――フリードランダーのJudah vs. the Machinesビデオ

    Facebook本社で犬種判別人工知能に挑戦――フリードランダーのJudah vs. the Machinesビデオ

    人工知能を作るにはまずいろいろと教え込まねばならない。犬種を判別させるなら、見たところボロ雑巾みたいに見える犬も何という犬種なのか教える必要がある。 Judah vs. the Machinesシリーズはコメディアンで俳優のジュダ・フリードランダーが「人類を救うために人間が世界のトップ人口知能と対決する」という番組で、今回はFacebookの本社に応用機械学習チームを訪れた。 続きを読む

  • Facebookのテキスト分類ライブラリfastTextがモデルのサイズを縮減してモバイルにも対応

    Facebookのテキスト分類ライブラリfastTextがモデルのサイズを縮減してモバイルにも対応

    今朝(米国時間5/2)、Facebookの人工知能研究所(Facebook AI Research, FAIR)が、同社の超高速でオープンソースのテキスト分類ライブラリfastTextのアップデートをリリースした。発表された当初のfastTextは90の言語の語ベクトルで訓練されていたが、今回のアップデートで295言語になる。また、モデルのサイズ、ひいてはメモリの必要量を抑える工夫が盛り込まれている。 続きを読む

  • YouTube、毎日ビデオ10億本を自動字幕化と発表

    YouTube、毎日ビデオ10億本を自動字幕化と発表

    Googleが最初にYouTubeに自動字幕化機能を導入したのは2009年のことだったが、結果は散々だった。しかしGoogleの音声認識機能は飛躍的進歩を遂げた。YouTubeの字幕化は現在でも多少の間違いは散見するものの、聴覚障害があるユーザーには欠かせない機能となっている。今日(米国時間2/16)、YouTubeチームが発表したところによると、毎日字幕を付加されるビデオは10億本、ユーザーは1500万人に上っているという。 続きを読む

  • 新生Microsoftの展望―市場は引き続きサティヤ・ナデラのリーダーシップに好感

    新生Microsoftの展望―市場は引き続きサティヤ・ナデラのリーダーシップに好感

    Microsoftがサティヤ・ナデラをCEOに選んだのは3年前になる。以來、Microsoftは運命の逆転を果たした。10年間にわたる不完全燃焼状態を脱し、成長株の地位を取り戻した。昨年もその勢いは続いた。 2016年にMicrosoftはクラウド・ベースのサービス提供企業への変身を続け、そのために複数の新たなプラットフォームをサポートした。LinkedInを262億ドルで買収するという大胆な賭けに出た。ハードウェアではSurfaceデバイスの拡充が続いた。こうした動きはすべてウォールストリートに歓迎された。Microsoftは Surf… 続きを読む

  • ザッカーバーグ家でホームAIが作動中―声はモーガン・フリーマンだった

    ザッカーバーグ家でホームAIが作動中―声はモーガン・フリーマンだった

    FacebookのCEO、マーク・ザッカーバーグが「2016年の決意」として自分でプログラミングしたホームアシスタントAIのJarvisが作動中だ。ザッカーバーグは月曜日にこの開発について詳しく書いた記事を投稿しているが、火曜には作動の様子を収めたビデオを公開した。Jarvisがザッカーバーグ家でマーク、妻のプリシラ、娘のマックスをそれぞれ認識してさまざまな機能を発揮しているようすがよく分かる。 続きを読む

  • AIが搭載された研究者向けの高機能検索エンジンSemantic Scholar

    AIが搭載された研究者向けの高機能検索エンジンSemantic Scholar

    科学論文はかなりの頻度で発行されており、主要な分野の最先端にいる人が論文の情報を追おうとすると、それだけでフルタイムの仕事になってしまうほどだ。しかし、論文サーチエンジンのSemantic Scholarは、自動で論文を読み込み、トピックやその影響力、引用回数などの情報を取り出す機能を備えており、ユーザーは簡単に最新の論文や探しているものをみつけることができる。 もしもあなたが科学者であれば、きっとこのようなサービスを求めていたことだろう。Google  ScholarやPudMedも便利なリソースではあるが、メタデータに関しては、著者や… 続きを読む

  • MicrosoftのConcept Graphは言葉や文から概念をつかみ、コンピューターに常識を持たせる

    MicrosoftのConcept Graphは言葉や文から概念をつかみ、コンピューターに常識を持たせる

    今日(米国時間11/1)はMicrosoft Researchが、自然言語処理における“知識”という問題の、解へ向かう努力の一環を公開した。同社によると、言葉に対する人間の理解とコンピューターの理解を分かつ最大の要因が、背景的知識とその正しい活用方法の有無だ、という。 続きを読む

  • 文章が読めるチャットボットを開発するMaluuba

    文章が読めるチャットボットを開発するMaluuba

    MaluubaがSiriのようなパーソナル・アシスタントを最初にローンチしたのは、4年前サンフランシスコで開催されたTechCrunch Disruptのイベントにおいてだった。それ以来、同社は1100万ドルの資金を調達し、そのテクノロジーを多数の携帯製造会社にライセンスした。それらの会社はそのテクノロジーを使って、自社の携帯にパーソナル・アシスタント機能を実装している。 続きを読む

  • Google、ニューラルネットワーク機械学習を検索翻訳に適用―第一陣は中国語/英語

    Google、ニューラルネットワーク機械学習を検索翻訳に適用―第一陣は中国語/英語

    ある言語を別の言語に翻訳するのは難しい作業だ。言語の自動翻訳システムを開発することはコンピュータ処理の目標の中でも非常に困難な部分だ。一つには、取り扱う対象となる語句の数が膨大になるからであり、それらを統べる規則を発見することは非常に難しい。幸いなことに、ニューラルネットワークは膨大かつ複雑なデータの自動的な処理が得意だ。 Googleは機械学習を利用した自動翻訳を長年にわたって開発してきたが、昨日(米国時間9/27)からその第一陣を公式にスタートさせている。 続きを読む

  • 自然言語によるチャットボット技術を提供するAngel.aiをAmazonが買収

    自然言語によるチャットボット技術を提供するAngel.aiをAmazonが買収

    昨日(米国時間9/19)はGoogleが、会話によるインタフェイスを提供するAPI.aiを買収したが、チャットボット方面の人材を求めている大手テク企業はGoogleだけではなさそうだ。本誌TechCrunchが得た情報によると、Angel.ai(元GoButler)が、少なくともその一部が、Amazonに買収された。 続きを読む

  • 自然言語によるコンピューターとの会話を実現するAPI集のAPI.AIをGoogleが買収

    自然言語によるコンピューターとの会話を実現するAPI集のAPI.AIをGoogleが買収

    Googleが今日(米国時間9/1)、API.AIのチームをスカウトしたことを公表した。API.AIは、Siriのような自然言語で会話できるボットをデベロッパーが作るためのツールを提供している。 コンピューターと違って人間には、まあまあのコミュニケーション能力がある。だれかが、“the girl saw a man with the binoculars”と言ったら、われわれは文脈的知識を動員して、「女の子が双眼鏡で男を見た」のか、それとも「女の子が双眼鏡を持ってる男を見た」のか、どちらであるかを正しく判断できる。… 続きを読む

  • Tableauが作るデータ視覚化図表に自然言語の説明文を自動的につけるNarrative ScienceのChromeエクステンション

    Tableauが作るデータ視覚化図表に自然言語の説明文を自動的につけるNarrative ScienceのChromeエクステンション

    (ビッグ)データ分析のTableau Softwareが、シカゴの自然言語生成(natural language generation NLG)ツールのデベロッパーNarrative Scienceとのパートナーシップを発表した。その直後にTableauの株価は13%跳ね上がった。このパートナーシップの結果として生まれる無料のChromeエクステンションNarratives for Tableauにより、Tableauが作るデータ視覚化図表に、自動的に説明文がつけられる。 続きを読む

  • Facebookの人工知能研究所がオープンソースで公開したfastTextは深層学習の遅さを克服したテキスト分類ソフトウェア

    Facebookの人工知能研究所がオープンソースで公開したfastTextは深層学習の遅さを克服したテキスト分類ソフトウェア

    Facebookでは毎日、何十億ものコンテンツがシェアされている。その膨大な量とペースに漏れなく遅れなく対応できるためにFacebookは、さまざまなツールを駆使してテキストを分類している。多層ニューラルネットワークのような従来的な方法は正確だが、ニューラルネットワークは訓練が大変である。 分類に正確さと容易さの両方をもたらすために、Facebookの研究部門Artificial Intelligence Research(FAIR)ラボはfastTextというものを開発した。そして今日(米国時間8/18)はそのfastTextがオープンソ… 続きを読む

  • その言葉は本気かそれとも皮肉か?、ニューラルネットワークがそれを見つける

    その言葉は本気かそれとも皮肉か?、ニューラルネットワークがそれを見つける

    テキストによるコミュニケーションには、皮肉やジョークを本気と読み誤る危険性がある。誰にも、その被害者や加害者になった経験があるだろう。そのことに相当懲りたポルトガルの研究者たちは、ニューラルネットワークを利用して、話者の意図が皮肉や嫌味であることを、判断しようとしている。 それは、日常の会話における誤解を防止することだけが目的ではない。コンピューターがメッセージのトーンと意味を正しく判断することは、いろんなことで重要だ。 続きを読む

  • 生命科学研究分野のGoogleを目指すBioz、Esther Dysonから300万ドルを調達

    生命科学研究分野のGoogleを目指すBioz、Esther Dysonから300万ドルを調達

    Biozは、研究者がインターネットに公開された何千という科学関連記事を流し読みするのにかかる時間を削減し、直ちに研究に関連性の高い知見を提供しようとする、生命科学実験専用の新しい検索エンジンだ。
    カリフォルニア州パロアルトに拠点を置くこのスタートアップは、自然言語処理を用いて公開されている科学論文から記事を抜粋して提供することでこれを実現している。Biozは、製品の選択、実験の計画、論文の執筆、助成金の申請、共同研究、実験と創薬の迅速化などにおいて実験者を支援するプラットフォームとなる。 続きを読む

  • API
    Google、クラウド自然言語APIを公開―英語、日本語、スペイン語に対応

    Google、クラウド自然言語APIを公開―英語、日本語、スペイン語に対応

    今日(米国時間7/20)、Googleはクラウド自然言語API(Cloud Natural Language API)の公開ベータ版をリリースしたことをブログで発表した。デベロッパーはこの新しいサービスにより、Googleが開発したセンチメント分析、 表現抽出、シンタックス解析などの利用が可能になる。 続きを読む

  • チャットボットには大きな将来性―ただし現行製品はどうしてああもダメなのだろう?

    チャットボットには大きな将来性―ただし現行製品はどうしてああもダメなのだろう?

    今年に入ってチャットボットについてのニュースをあちこちで見かけるようになった。まずMicrosoftがTayを発表したが、>女性の声でしゃべるのが性差別主義的だと非難されただけでなく、悪意あるユーザーに教えられた通りにあらぬことを口走るようになってしまった。次にFacebookがMessengerのボットをリリースしたが、上々の滑り出しとはみえない。それからAppleのVivが話題となった。一見したところSiri 2.0のように思えたのも無理はなく、開発者はSiriと同じだった。 続きを読む

  • TechCrunch Disrupt:Siriの共同ファウンダーが音声認識で会話する次世代AI、Vivアプリをデモ

    TechCrunch Disrupt:Siriの共同ファウンダーが音声認識で会話する次世代AI、Vivアプリをデモ

    自然言語の音声認識をベースにした人工知能インターフェイスの有用性はコンピューティングにおける新たなパラダイムシフトを起こしつつある。 今日(米国時間5/9)、ブルックリンで開幕したTechCrunch Disrupt NYのステージで、Siriの共同ファウンダー、元CEOのDag Kittlausが新しい人工知能プラットフォーム、Vivで開発されたアプリを初めて公開デモした。Kittlausによれば、Vivは「すべてに対応する知的インターフェイス( intelligent interface for everything)」だという。… 続きを読む

  • AppleのSiriがアメリカと世界のプロ野球雑学博士になった

    AppleのSiriがアメリカと世界のプロ野球雑学博士になった

    プロ野球の今年のシーズンの開幕に合わせて、Appleは野球のデータや雑学知識をたっぷりとSiriの脳に詰め込んだ。 そこで今のSiriはベーブルースの生涯打率を知ってるし、2008年の、フィリーズが優勝したワールドシリーズのときのラインナップだけでなく、なんと1934年のワールドシリーズについても知ってる。 Siriは、全世界の29のプロ野球リーグについても勉強した。今ではMLBだけでなく、Cape Cod LeagueやNippon Pro Baseball(日本野球機構)のことも質問できる。これらのリーグは、選手個人のデータはないが、試合結果… 続きを読む

  • Google Docsの編集や書式化の指示を音声(“口頭命令”)でできる

    Google Docsの編集や書式化の指示を音声(“口頭命令”)でできる

    約6か月前にGoogleは、Google Docsに、音声によるテキスト入力(“口述入力”)を導入した。そして今日同社は、それをさらに一歩進めて、編集や書式化の指示も音声でできるようにした。 つまりこれからは、”select all”(すべて選択)、”align center”(センタリング)、”bold”(太字)、”got to end of line”(行末へ)、”increase font size”(文字… 続きを読む

  • テキストの目的効果パフォーマンスを分析するTextioが$8Mを調達、TwitterやMicrosoftもユーザだ

    テキストの目的効果パフォーマンスを分析するTextioが$8Mを調達、TwitterやMicrosoftもユーザだ

    TextioのCEO Kieran Snyderは大学で、定量的言語学研究を専攻した。だから彼女と協同ファウンダのJensen HarrisがMicrosoftを去って新しい会社を始めたとき、それが言語を軸とする企業になったのも、当然の成り行きだった。 かくして、一定の状況における、テキスト中の語句のパフォーマンスを分析するスタートアップTextioが誕生した。同社は今日(米国時間12/16)、Emergence Capitalが率いるラウンドで800万ドルを調達したことを発表した。Cowboy VenturesとBloomberg Beta、およ… 続きを読む

  • ぼくが悪いのか、それとも、Appleの自動修正機能が最近だめになったのか?

    ぼくが悪いのか、それとも、Appleの自動修正機能が最近だめになったのか?

    この経験は、誰にでもある。iPhoneでタイプしていると、自動修正によってチャットの内容が完全に変わってしまう。 “ducks”は”dicks”になり*1、”f**ks”(fucks)は”ducks”になる。blonde girlsがblindになり*2、食料品やケーキなどをオーダーするシンプルなメッセージが突然ホラーストーリーになる。〔*1: 「女の子たち」が「ぽこちん」になり; *2: 「金髪の女の子」が「盲目」になり〕, みんなジョークは言うけど… 続きを読む

  • 複雑膨大すぎてGoogle検索では対応できない法律文書にWatsonのNLPを適用するROSS Intelligence

    今の法律関連の情報や裁判の判例などは複雑膨大だから、いくつかのキーワードで検索したぐらいでは、役に立つ情報がなかなか見つからない。 そこでY Combinatorから孵化したROSS Intelligenceは、IBMの人工知能システムWatsonの自然言語処理(NLP, natural language processin)の能力を利用して、法律文書をふるいにかけようとしている。 ドキュメントをキーワードで検索するのではなく、ふつうの英語で“Can an automatic stay be lifted if a plaintiff in another… 続きを読む