Boolean Multiplexer environment

Norbert Kozlowski · Norbert Kozlowski · commit c61ec17576ba · 2017-11-18T18:39:31.000+01:00
diff --git a/README.md b/README.md
@@ -1,9 +1,14 @@
-# openai-maze-envs
+# Parrot Prediction OpenAI environments
+
+## Maze
 
 Initializing
 
     maze = gym.make('MazeF1-v0')
 
 Getting all possible transitions
 
-    transitions = maze.env.get_all_possible_transitions()
+    transitions = maze.env.get_all_possible_transitions()
+
+## Boolean Multiplexer
+Read blog [post](https://medium.com/parrot-prediction/boolean-multiplexer-in-practice-94e3236821b5) describing the usage.
diff --git a/ex.py b/ex.py
diff --git a/examples/maze.py b/examples/maze.py
@@ -0,0 +1,33 @@
+import logging
+from random import choice
+
+import gym
+
+# noinspection PyUnresolvedReferences
+import gym_maze
+
+logging.basicConfig(level=logging.DEBUG)
+
+if __name__ == '__main__':
+    maze = gym.make('MazeF1-v0')
+
+    possible_actions = list(range(8))
+    transitions = maze.env.get_all_possible_transitions()
+
+    for i_episode in range(1):
+        observation = maze.reset()
+
+        for t in range(100):
+            logging.info("Time: [{}], observation: [{}]".format(t, observation))
+
+            action = choice(possible_actions)
+
+            logging.info("\t\tExecuted action: [{}]".format(action))
+            observation, reward, done, info = maze.step(action)
+
+            if done:
+                logging.info("Episode finished after {} timesteps.".format(t + 1))
+                logging.info("Last reward: {}".format(reward))
+                break
+
+    logging.info("Finished")
diff --git a/gym_maze/Maze.py b/gym_maze/Maze.py
@@ -1,7 +1,3 @@
-import logging
-
-logger = logging.getLogger(__name__)
-
 PATH_MAPPING = 0
 WALL_MAPPING = 1
 REWARD_MAPPING = 9
diff --git a/gym_maze/__init__.py b/gym_maze/__init__.py
@@ -1,11 +1,7 @@
-import logging
-
 from gym.envs.registration import register
 
-from gym_maze.Maze import Maze
-from gym_maze.Maze import PATH_MAPPING, WALL_MAPPING, REWARD_MAPPING
-
-logger = logging.getLogger(__name__)
+# noinspection PyUnresolvedReferences
+from gym_maze.Maze import Maze, PATH_MAPPING, WALL_MAPPING, REWARD_MAPPING
 
 ACTION_LOOKUP = {
     0: 'N',
diff --git a/gym_maze/envs/AbstractMaze.py b/gym_maze/envs/AbstractMaze.py
@@ -1,17 +1,13 @@
-import gym
-from gym import error, spaces, utils
-from gym.utils import seeding
-
-from gym_maze import Maze, WALL_MAPPING, ACTION_LOOKUP
-from gym_maze.utils import get_all_possible_transitions
-
-import numpy as np
 import logging
 import random
 import sys
 
+import gym
+import numpy as np
+from gym import spaces, utils
 
-logger = logging.getLogger(__name__)
+from gym_maze import Maze, WALL_MAPPING, ACTION_LOOKUP
+from gym_maze.utils import get_all_possible_transitions
 
 ANIMAT_MARKER = 5
 
@@ -38,7 +34,7 @@ def _step(self, action):
         return observation, reward, episode_over, {}
 
     def _reset(self):
-        logger.debug("Resetting the environment")
+        logging.debug("Resetting the environment")
         self._insert_animat()
         return self._observe()
 
diff --git a/gym_maze/tests/test_utils.py b/gym_maze/tests/test_utils.py
@@ -1,4 +1,5 @@
 import gym
+# noinspection PyUnresolvedReferences
 import gym_maze
 
 
diff --git a/gym_multiplexer/__init__.py b/gym_multiplexer/__init__.py
@@ -0,0 +1,27 @@
+from .boolean_multiplexer import BooleanMultiplexer
+
+from gym.envs.registration import register
+
+name = "boolean-multiplexer"
+max_episode_steps = 1
+
+register(
+    id='{}-3bit-v0'.format(name),
+    entry_point='gym_multiplexer:BooleanMultiplexer',
+    max_episode_steps=max_episode_steps,
+    kwargs={'control_bits': 1}
+)
+
+register(
+    id='{}-6bit-v0'.format(name),
+    entry_point='gym_multiplexer:BooleanMultiplexer',
+    max_episode_steps=max_episode_steps,
+    kwargs={'control_bits': 2}
+)
+
+register(
+    id='{}-11bit-v0'.format(name),
+    entry_point='gym_multiplexer:BooleanMultiplexer',
+    max_episode_steps=max_episode_steps,
+    kwargs={'control_bits': 3}
+)
diff --git a/gym_multiplexer/boolean_multiplexer.py b/gym_multiplexer/boolean_multiplexer.py
@@ -0,0 +1,52 @@
+import logging
+import random
+
+import gym
+from bitstring import BitArray
+from gym.spaces import Discrete
+
+
+class BooleanMultiplexer(gym.Env):
+
+    def __init__(self, control_bits=3) -> None:
+        self.metadata = {'render.modes': ['human']}
+        self.control_bits = control_bits
+        self.observation_space = Discrete(len(self._observation_string_length))
+        self.action_space = Discrete(2)
+
+    def _reset(self):
+        logging.debug("Resetting the environment")
+        bits = BitArray([random.randint(0, 1) for _ in
+                         self._observation_string_length])
+
+        self._ctrl_bits = bits[:self.control_bits]
+        self._data_bits = bits[self.control_bits:]
+
+    def _step(self, action):
+        state = self._observation()
+        reward = 0
+
+        if action == self._answer:
+            reward = 1
+
+        return state, reward, None, None
+
+    def _render(self, mode='human', close=False):
+        if close:
+            return
+
+        if mode == 'human':
+            return self.control_bits + self._data_bits
+        else:
+            super(BooleanMultiplexer, self).render(mode=mode)
+
+    def _observation(self):
+        return self.control_bits + self._data_bits
+
+    @property
+    def _observation_string_length(self):
+        return range(0, self.control_bits + pow(2, self.control_bits))
+
+    @property
+    def _answer(self):
+        return int(self._data_bits[self._ctrl_bits.uint])
diff --git a/gym_multiplexer/tests/__init__.py b/gym_multiplexer/tests/__init__.py
diff --git a/gym_multiplexer/tests/test_multiplexer.py b/gym_multiplexer/tests/test_multiplexer.py
@@ -0,0 +1,52 @@
+import logging
+import random
+import sys
+
+import gym
+
+# noinspection PyUnresolvedReferences
+import gym_multiplexer
+
+logging.basicConfig(level=logging.DEBUG, stream=sys.stdout)
+
+
+class TestMultiplexer:
+
+    def test_should_initialize_multiplexer(self):
+        # when
+        mp = gym.make('boolean-multiplexer-6bit-v0')
+
+        # then
+        assert mp is not None
+        assert 6 == mp.observation_space.n
+        assert 2 == mp.action_space.n
+
+    def test_should_render_state(self):
+        # given
+        mp = gym.make('boolean-multiplexer-3bit-v0')
+        mp.reset()
+
+        # when
+        state = mp.render()
+
+        # then
+        assert state is not None
+        assert 3 == len(state)
+
+    def test_should_execute_step(self):
+        # given
+        mp = gym.make('boolean-multiplexer-3bit-v0')
+        mp.reset()
+        action = self._random_action()
+
+        # when
+        state, reward, done, _ = mp.step(action)
+
+        # then
+        assert state is not None
+        assert reward in [0, 1]
+        assert done is True
+
+    @staticmethod
+    def _random_action():
+        return random.sample([0, 1], 1)
diff --git a/requirements.txt b/requirements.txt
@@ -1,3 +1,3 @@
-gym==0.9.4
-networkx==2.0
+-e .
+
 pytest==3.2.3
diff --git a/setup.py b/setup.py
@@ -1,8 +1,8 @@
 from setuptools import setup, find_packages
 
-setup(name='gym_maze',
-      version='0.0.6',
-      description='Maze environments for OpenAI Gym Environment',
+setup(name='parrot_envs',
+      version='0.0.7',
+      description='Custom environments for OpenAI Gym Environment',
       keywords='acs lcs machine-learning reinforcement-learning openai',
       url='https://github.com/ParrotPrediction/openai-maze-envs',
       author='Parrot Prediction',
@@ -11,7 +11,8 @@
       packages=find_packages(),
       install_requires=[
           'gym==0.9.4',
-          'networkx==2.0'
+          'networkx==2.0',
+          'bitstring==3.1.5'
       ],
       include_package_data=False,  # We don't have other types of files
       zip_safe=False)

Original file line number	Diff line number	Diff line change
`@@ -1,4 +1,5 @@`
`1`	`1`	`import gym`
	`2`	`+# noinspection PyUnresolvedReferences`
`2`	`3`	`import gym_maze`
`3`	`4`
`4`	`5`