{"payload":{"header_redesign_enabled":false,"results":[{"id":"100534199","archived":false,"color":"#3572A5","followers":17,"has_funding_file":false,"hl_name":"akshaykhadse/reinforcement-learning","hl_trunc_description":"Implementations of basic concepts dealt under the Reinforcement Learning umbrella. This project is collection of assignments in CS747: Fo…","language":"Python","mirror":false,"owned_by_organization":false,"public":true,"repo":{"repository":{"id":100534199,"name":"reinforcement-learning","owner_id":18427356,"owner_login":"akshaykhadse","updated_at":"2018-05-21T14:07:41.292Z","has_issues":true}},"sponsorable":false,"topics":["reinforcement-learning","linear-programming","thompson-sampling","epsilon-greedy","ucb","policy-evaluation","mdps","multi-armed-bandits","policy-iteration","randomised-algorithms","reinforcement-learning-excercises","kl-divergence","markovian-epidemic-processes","reinforcement-learning-analysis","multiarm-bandit","ucb1","howards-pi","batch-switching","randomized-policy-iteration"],"type":"Public","help_wanted_issues_count":0,"good_first_issue_issues_count":0,"starred_by_current_user":false}],"type":"repositories","page":1,"page_count":1,"elapsed_millis":88,"errors":[],"result_count":1,"facets":[],"protected_org_logins":[],"topics":null,"query_id":"","logged_in":false,"sign_up_path":"/signup?source=code_search_results","sign_in_path":"/login?return_to=https%3A%2F%2Fgithub.com%2Fsearch%3Fq%3Drepo%253Aakshaykhadse%252Freinforcement-learning%2B%2Blanguage%253APython","metadata":null,"csrf_tokens":{"/akshaykhadse/reinforcement-learning/star":{"post":"8zyrLofVnSTq6d9THSJx5ZaY0g4blZmZ4UO3iqiBTD-_iloC_Nma6eulgZHw_6SreH2AcxqvieLQhZZK1WWVAg"},"/akshaykhadse/reinforcement-learning/unstar":{"post":"7GDsLE-dL882XKXuETOxwEGSEv7AgzlCuploUXDXsWu1NFskUwQHKezcVtP5mz4_hHo5tqhyByOQp7p4Gvkf-Q"},"/sponsors/batch_deferred_sponsor_buttons":{"post":"4EgPwQ7S26KelAEsUOaN6vLqYtHBnXNmVZk4HKd5qQeZifLHxX-kXye6D0xxpO7tUwPqqajfO--duPtLOXk6Rw"}}},"title":"Repository search results"}