пятница, 8 февраля 2013 г.

топ-10 женскиз имен

8. Перемножим полученные частоты полных имен с весовыми коэффициентами и просуммируем результаты по годам рождения.

7. Посчитаем весовые коэффициенты для каждой группы, используя данные Росстата о численности населения по возрастным группам.

6. Посчитаем частоту упоминания полных имен по каждому году рождения из выбранного диапазона.

5. Сопоставим каждому указанному имени в профиле полное имя.

4. Отфильтруем профили по году рождения: возьмем совершеннолетних пользователей 1941-1993 г.р.

3. Вытащим из каждого профиля имя, год рождения и пол пользователя.

2. Отберем российские профили.

1. Сформируем репрезентативную выборку профилей из социальной сети «Одноклассники»;

Проделаем следующее:

5) и один аналитик.

4) один программист;

3) данные Росстата о демографии по возрастным группам (для расчета весовых коэффициентов);

2) библиотека уменьшительно-ласкательных имен (для объединения всевозможных написаний имен в полные имена);

1) выборка российских профилей из социальной сети «Одноклассники» (в ней в достаточном объеме представлены люди всех возрастных групп);

Для расчета рейтинга нам потребуется:

Если взять выборку профилей из соцсетей, вытащить из них имена и даты рождения, посчитать частоту упоминания каждого имени по годам рождения и полученные результаты домножить на весовые коэффициенты численности населения России в зависимости от возрастных групп по данным Росстата, то можно получить рейтинг популярности имен.

Опубликовано в

Какой рейтинг у вашего имени?

» Какой рейтинг у вашего имени?

Какой рейтинг у вашего имени? | QuantResearch

Комментариев нет:

Отправить комментарий