Добрый день!
Нужна помощь в анализе Pandas Data Frame (Python). Я новичок в пайтон и мне для учебы нужно проанализировать данные. Я примерно поняла как делать сам анализ, но для этого мне нужно подготовить данные, чтобы они выглядели определенным образом.
Изначально данные были в формате JSON. Я написала функцию, которая эти данные отображает как многоуровневый Data Frame. Теперь мне нужно:
1. Создать функцию, которая будет удалять первый ряд в каждом из 1000 рядов более низкого уровня; (тут наверняка можно сделать for loop, но я не поняла как). Там сейчас по 50 (с 0 по 49) значений, нужно чтоб осталось 49 значений (с 1 по 49).
2. Потом там есть колонки trial, action, belief, observation, reward_selling, reward_waiting и state. Нужно создать функцию, которая бы обрезала каждые из этих 49 рядов на том месте, где action впервые перестает быть 0 и становится 1 (поэтому важно убрать до этого первый ряд, поскольку он всегда 1). Важно! Эту первую единицу мы тоже оставляем.
3. Исходя из этого создать Data Frame, в которых будет просто написано количество рядов (как цифра) в каждом из 1000 trials (т.е. изначально было по 50 всегда, а сколько осталось).
4. Отдельно, с сохранением предыдущего создать еще одну Data Frame. Нужно посмотреть где state поменялся с 0 на 1 и в Data Frame оставить значение, которое равняется разнице номера ряда где поменялось значение state минус номер ряда, где произошло первое изменение action c 0 на 1. Например у нас идут значения 0,1,2,3,4,5,6 на 4 поменялся state, а на 6 – action. Значит в data frame должно быть указано 2. Если же action был на 4, а state на 6 – то -2.
5. Желательно сделать это в Jupyter Notebooks (см. прикрепленные файлы) и с комментариями, поскольку я хочу понять, как это сделать.
Спасибо и хорошего дня!
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |