強化学習 in English translation

reinforcement learning

Examples of using 強化学習 in Japanese and their translations into English

{-}
  • Colloquial category close
  • Ecclesiastic category close
  • Computer category close
  • Programming category close
機械学習によるイノベーションの何がAndyを魅了したのか?「現在は、強化学習やGAN、フェデレーションラーニングなどの技術を当社の問題領域に応用する可能性に非常に期待しています。
What sort of machine learning innovations intrigue Andy?"Right now, I'm really excited about the potential of applying techniques such as reinforcement learning, GANs, and federated learning to our problem domain.
ここでは当NPO法人の第3回ハッカソンの他に、強化学習アーキテクチャ勉強会、AI社会論研究会などといった当NPO法人活動に関連の深いイベントも継続的に開催される予定です。
Φcafe will host the third annual WBA Hackathon and other events related to the activities of WBAI, including study meetings focused on reinforcing learning and the AI and Society Meetings.
本研究は報酬予測と実報酬をコードする細胞がPPTNに存在することを証明し、強化学習神経機構の解明に大きな一歩を記すものです。
This research has proved the existence of the cell in PPTN that encodes the predicted reward errors, marking a leap for uncovering the neural mechanism of reinforcement learning.
一方、最近の囲碁世界チャンピオンに人工知能が勝利したことで、教師なし学習、強化学習、深層ニューラルネットワークをうまく組み合わせると、人工知能が人の知性または、それ以上の知性を持てることを示した。
On the other hand, the recent success of artificial intelligence in beating a Go world champion has demonstrated that exquisite combination of supervised learning, reinforcement learning, and representation learning by deep neural networks can achieve human level or higher intelligence.
CCNBook運動制御と強化学習(全脳アーキテクチャ・イニシアティブによる要約)CCNBook実行機能(全脳アーキテクチャ・イニシアティブによる要約)オライリーのモデルは作業記憶のモデルでもあることにご注意ください前頭前皮質大脳基底核作業記憶モデル。
Motor Control and Reinforcement Learning in CCNBook(our summary) Executive Function in CCNBook(our summary) Note that O'Reilly's model is also a model of working memory PBWM: the Prefrontal cortex Basal ganglia Working Memory model.
強化学習モデルに対して敵対的攻撃を加えることにより、自律型軍用無人偵察機は一連の意図しない標的への攻撃を強要され、財産の破壊、人命の犠牲、および軍事紛争の拡大を引き起こします。
By use of an adversarial attack against a reinforcement learning model, autonomous military drones are coerced into attacking a series of unintended targets, causing destruction of property, loss of life, and the escalation of a military conflict.
攻撃シナリオ:軍用無人偵察機をハイジャックする強化学習モデルに対して敵対的攻撃を加えることにより、自律型軍用無人偵察機は一連の意図しない標的への攻撃を強要され、財産の破壊、人命の犠牲、および軍事紛争の拡大を引き起こします。
Attack scenario: hijack autonomous military drones By use of an adversarial attack against a reinforcement learning model, autonomous military drones are coerced into attacking a series of unintended targets, causing destruction of property, loss of life, and the escalation of a military conflict.
A02並列深層強化学習グーグルディープマインド社の提案した深層強化学習は人間と同程度にビデオゲームをプレイし、囲碁のエキスパートに勝利するなど非常に高度な制御則を自律的に学習できることを示しました。
A02Parallel deep reinforcement learning Google DeepMind showed the first widely remarkable success for Deep Reinforcement Learning(DRL) that can autonomously learn highly advanced control policies such as playing video games to the same extent as human experts and winning experts in Go.
A02モデルフリーモデルベースの協同による深層並列強化学習行動学習モデルの一つである強化学習は環境のモデルを必要としないモデルフリー法、環境のモデルを推定して活用するモデルベース法に大別できます。
A02Deep Parallel Reinforcement Learning with Model-Free and Model-Based Methods Reinforcement learning, which is a computational model of behavior learning, can be divided into model-free methods that do not require environmental models and model-based methods that estimate and use them explicitly.
ディープラーニング、強化学習、そしてニューラルネットは、それぞれより深い議論に進むことが可能だが、願わくばこの記事を読んだ後、読者のこの分野への見通しが良くなって、日々私たちがTechCrunchで取り上げている沢山の企業間の関連が理解しやすくなることを期待している。
Deep learning, reinforcement learning and neural nets could all stand on their own but hopefully after reading this post you can visualize the field itself and draw connections to many of the companies we cover daily on TechCrunch.
このロボットは、シミュレーションや強化学習など、さまざまな技法で訓練され、実際に廃棄物汚染の度合いを、およそ20パーセントから5パーセント未満にまで低減することができた(たとえば、所定のゴミ箱に間違ったゴミを入れてしまったら、そのゴミ箱の中身全体がリサイクルされることなく埋め立てられてしまう)。
The robot, trained via simulation and reinforcement learning, among other techniques, managed to actually reduce the level of waste contamination(putting the wrong garage in the wrong place and causing the whole contents of that bin to go to the landfill instead of being recycled, for instance) from around 20 percent to under 5.
このロボットは、シミュレーションや強化学習など、さまざまな技法で訓練され、実際に廃棄物汚染の度合いを、およそ20パーセントから5パーセント未満にまで低減することができた(たとえば、所定のゴミ箱に間違ったゴミを入れてしまったら、そのゴミ箱の中身全体がリサイクルされることなく埋め立てられてしまう)。
The robot, trained via simulation and reinforcement learning, among other techniques, managed to actually reduce the level of waste contamination(putting the wrong garage in the wrong place and causing the whole contents of that bin to go to the landfill instead of being recycled, for instance) from around 20% to less than 5.
これは「意識」が行っていることと同じだとも考えられますが、それを「クオリア」と呼ぶかどうかは人によります。ロボットの強化学習プログラムでは、報酬信号は、その直前の状態や行動を再現する確率を高めるという働きをするだけです。
It can be thought that this is the same as what"conscious" does, but it depends on people whether to call it"qualia". In the reinforcement learning program of the robot, the reward signal only acts to increase the probability of reproducing the state or action immediately before it.
強化学習
Reinforcement learning.
マルチエージェント強化学習
Multi-Agent Reinforcement Learning.
DeepRacerと強化学習
DeepRacer and reinforcement learning.
強化学習の枠組み。
The Reinforcement Learning framework.
強化学習の枠組み。
General reinforcement learning framework.
強化学習とQ学習。
Reinforcement learning with Q learning..
強化学習には…。
Reinforcement learning is….
Results: 697, Time: 0.0954

強化学習 in different Languages

Word-for-word translation

Top dictionary queries

Japanese - English