8. Перемножим полученные частоты полных имен с весовыми коэффициентами и просуммируем результаты по годам рождения.
7. Посчитаем весовые коэффициенты для каждой группы, используя данные Росстата о численности населения по возрастным группам.
6. Посчитаем частоту упоминания полных имен по каждому году рождения из выбранного диапазона.
5. Сопоставим каждому указанному имени в профиле полное имя.
4. Отфильтруем профили по году рождения: возьмем совершеннолетних пользователей 1941-1993 г.р.
3. Вытащим из каждого профиля имя, год рождения и пол пользователя.
2. Отберем российские профили.
1. Сформируем репрезентативную выборку профилей из социальной сети «Одноклассники»;
Проделаем следующее:
5) и один аналитик.
4) один программист;
3) данные Росстата о демографии по возрастным группам (для расчета весовых коэффициентов);
2) библиотека уменьшительно-ласкательных имен (для объединения всевозможных написаний имен в полные имена);
1) выборка российских профилей из социальной сети «Одноклассники» (в ней в достаточном объеме представлены люди всех возрастных групп);
Для расчета рейтинга нам потребуется:
Если взять выборку профилей из соцсетей, вытащить из них имена и даты рождения, посчитать частоту упоминания каждого имени по годам рождения и полученные результаты домножить на весовые коэффициенты численности населения России в зависимости от возрастных групп по данным Росстата, то можно получить рейтинг популярности имен.
Опубликовано в
Какой рейтинг у вашего имени?
» Какой рейтинг у вашего имени?
Какой рейтинг у вашего имени? | QuantResearch
Комментариев нет:
Отправить комментарий