Викиверситет
ruwikiversity
https://ru.wikiversity.org/wiki/%D0%97%D0%B0%D0%B3%D0%BB%D0%B0%D0%B2%D0%BD%D0%B0%D1%8F_%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D0%B0
MediaWiki 1.39.0-wmf.23
first-letter
Медиа
Служебная
Обсуждение
Участник
Обсуждение участника
Викиверситет
Обсуждение Викиверситета
Файл
Обсуждение файла
MediaWiki
Обсуждение MediaWiki
Шаблон
Обсуждение шаблона
Справка
Обсуждение справки
Категория
Обсуждение категории
Портал
Обсуждение портала
Факультет
Обсуждения факультета
TimedText
TimedText talk
Модуль
Обсуждение модуля
Гаджет
Обсуждение гаджета
Определение гаджета
Обсуждение определения гаджета
Программирование Викиданных/field of work (math)
0
23406
150436
130036
2022-08-08T16:13:18Z
Андрей Бондарь
17084
ё
wikitext
text/x-wiki
== Постановка цели ==
Цели:<br />
1. На основе викиданных выявить наиболее популярные области, которыми занимались/занимаются (российские?) математики и определить их взаимосвязь.<br />
Задачи:
*Заполнить в ВД у персон такие свойства как "field of work", "occupation", "country of citizenship".
*Написать необходимые SPARQL-запросы.
*На основе полученных результатов составить таблицу пересечений наиболее популярных областей математики друг с другом.
2. Сравнить рейтинг ученого и количество изучаемых им наук. Определить зависимость этих двух характеристик.<br />
Задачи:
*Заполнить таблицу с рейтингом ученых.
*Написать SPARQL-запрос, который считает количество изучаемых наук математика.
*Сравнить.
+ связь возраста и наград в разных областях (возможно, эти вопросы можно будет передать Дмитрию):
# Определить возраст (min, max, avg) получения первой награды. Меняется ли и как меняется этот возраст с каждым десятилетием?
# Работников каких областей математики награждают больше, чаше? Можно ли выделить разные эпохи в математике по превалирующим наградам в разных областях?
# Какие регионы чаще награждают?
# Выпускников каких вузов чаще награждают?
== Задачи ==
* Дано: математик и свойство Викиданных ("Область математики", "field of work").
* Найти области математики, которой занимался математик. Извлечь: (1) область математики.
Пример:
* Объекты: [[d:Q1322048|Eliyahu Rips (Q1322048)]]
* Свойства: [[d:Property:P101|field of work (P101)]]
<source lang="SPARQL">#added 2016-11
#Get 'field of work` of some person
SELECT ?work ?workLabel
WHERE
{
wd:Q1322048 wdt:P101 ?work.
SERVICE wikibase:label { bd:serviceParam wikibase:language "en" }
}</source>
[https://query.wikidata.org/#%23added%202016-11%0A%23Get%20%27field%20of%20work%60%20of%20some%20person%0ASELECT%20%3Fwork%20%3FworkLabel%0AWHERE%0A%7B%0A%20%20%20%20wd%3AQ1322048%20wdt%3AP101%20%3Fwork.%0A%20%20%20%20SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22en%22%20%7D%0A%7D SPARQL query] 1 Results:
* [[d:wd:Q874429|group theory]]
* Дано: поле описания: "Russian mathematician"; свойство Викиданных: "field of work".
* Найти: области математики, которыми занимались российские математики. Извлечь: (1) имя математика, (2) field of work.
Пример:
* Свойство: [[d:Property:P101|field of work (P101)]]; поле описания: "Russian mathematician"
<source lang="SPARQL">SELECT ?item ?label ?field_of_work ?field_of_workLabel
WHERE
{
?item schema:description "Russian mathematician"@en.
?item wdt:P101 ?field_of_work.
?item rdfs:label ?label.
SERVICE wikibase:label { bd:serviceParam wikibase:language "en" }
?item rdfs:label ?label.
FILTER(LANG(?label) = "ru")
}
</source>
[https://query.wikidata.org/#SELECT%20%3Fitem%20%3Flabel%20%3Ffield_of_work%20%3Ffield_of_workLabel%0AWHERE%0A%7B%0A%20%20%09%3Fitem%20schema%3Adescription%20%22Russian%20mathematician%22%40en.%0A%09%3Fitem%20wdt%3AP101%20%3Ffield_of_work.%0A%20%20%20%20%3Fitem%20rdfs%3Alabel%20%3Flabel.%0A%20%20%20%20%20SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22en%22%20%7D%0A%20%20%20%20%20%20%20%20%20%20%3Fitem%20rdfs%3Alabel%20%3Flabel.%0A%20%20%20%20%20%20%20%20%20FILTER%28LANG%28%3Flabel%29%20%3D%20%22ru%22%29%0A%20%20%7D%0A SPARQL query] 2221 Results;
=== Сбор статистики по научным областям ===
* Дано: свойства Викиданных ("field of work", "date of birth", "date of death"); поле описания: "Russian mathematician".
* Найти: области математики, которыми занимались российские математики. Извлечь: (1) имя математика, (2) field of work, (3) age.
Пример:
* Свойства:[[d:Property:P101|field of work (P101)]]; [[d:Property:P569|date of birth (P569)]]; [[d:Property:P570|date of death (P570)]]
<source lang="SPARQL">SELECT ?item ?label ?field_of_work ?field_of_workLabel ?age
WHERE
{
?item schema:description "Russian mathematician"@en.
?item wdt:P101 ?field_of_work.
?item wdt:P569 ?dob . # date of birth
?item wdt:P570 ?dod . # date of death
BIND(YEAR(?dod)-YEAR(?dob) as ?age) #age
SERVICE wikibase:label { bd:serviceParam wikibase:language "en" }
?item rdfs:label ?label.
FILTER(LANG(?label) = "ru").
}
</source>
[https://query.wikidata.org/#SELECT%20%3Fitem%20%3Flabel%20%3Ffield_of_work%20%3Ffield_of_workLabel%20%20%20%3Fage%0AWHERE%0A%7B%0A%09%3Fitem%20schema%3Adescription%20%22Russian%20mathematician%22%40en.%0A%20%20%20%20%3Fitem%20wdt%3AP101%20%3Ffield_of_work.%20%0A%20%20%20%20%3Fitem%20wdt%3AP569%20%3Fdob%20.%20%23%20date%20of%20birth%0A%20%09%3Fitem%20wdt%3AP570%20%3Fdod%20.%20%23%20date%20of%20death%0A%20%09%09BIND%28YEAR%28%3Fdod%29-YEAR%28%3Fdob%29%20as%20%3Fage%29%20%23age%0A%20%20%20%20%20%20%20%20%20%20SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22en%22%20%7D%0A%20%20%20%20%20%20%20%20%20%20%3Fitem%20rdfs%3Alabel%20%3Flabel.%0A%20%20%20%20%20%20%20%20%20%20FILTER%28LANG%28%3Flabel%29%20%3D%20%22ru%22%29.%0A%20%20%7D%0A%0A%0A SPARQL query]
1493 Results
Построить график: Display >> Graph builder >> Ось х: field_of_work или occup; ось у: age.
==== Уточнение и варианты поиска математиков ====
* список персон с указанием, что занимается математикой ([https://query.wikidata.org/#SELECT%20%3Fitem%20%3Flabel%20%0AWHERE%0A%7B%0A%20%20%23%20%3Fitem%20schema%3Adescription%20%22Russian%20mathematician%22%40en.%0A%20%20%3Fitem%20wdt%3AP106%20wd%3AQ170790.%20%23%20occupation%20is%20%27mathematician%27%0A%0A%09%09%3Fitem%20rdfs%3Alabel%20%3Flabel.%0A%20%20%20%20FILTER%28LANG%28%3Flabel%29%20%3D%20%22ru%22%29.%0A%20%20%7D%0A%0A%0A SPARQL query]): 3830 записей (математики всего мира).<source lang="SPARQL">?item wdt:P106 wd:Q170790. # occupation is 'mathematician'
</source>
* Способ выбора персон: (1) фильтр по "country of citizenship" Россия или СССР или Российская империя, (2) область занятий - математика.([https://query.wikidata.org/#SELECT%20%3Fitem%20%3Flabel%20%3Ffield_of_work%20%3Ffield_of_workLabel%0AWHERE%0A%7B%20%20%0A%20%20%3Fitem%20wdt%3AP106%20wd%3AQ170790%20.%20%23%20occupation%20is%20%27mathematician%27%0A%20%20%3Fitem%20wdt%3AP101%20%3Ffield_of_work%20.%20%23%20field_of_work%0A%20%7B%0A%20%20%20%20%7B%20%3Fitem%20wdt%3AP27%20wd%3AQ34266%20%7D%20UNION%20%23%20country%20of%20citizenship%20Russian%20Empire%0A%20%20%20%20%7B%20%3Fitem%20wdt%3AP27%20wd%3AQ15180%20%7D%20UNION%20%23%20country%20of%20citizenship%20%20Soviet%20Union%0A%20%20%20%20%7B%20%3Fitem%20wdt%3AP27%20wd%3AQ159%20%7D%20%23%20country%20of%20citizenship%20Russia%0A%20%20%7D%0ASERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22en%22%20%7D%0A%3Fitem%20rdfs%3Alabel%20%3Flabel.%0AFILTER%28LANG%28%3Flabel%29%20%3D%20%22ru%22%29.%0A%20%20%7D%0A%20%20%0A SPARQL query]): 3186 записей.
<source lang="SPARQL">
{ ?item wdt:P27 wd:Q34266 } UNION # country of citizenship Russian Empire
{ ?item wdt:P27 wd:Q15180 } UNION # country of citizenship Soviet Union
{ ?item wdt:P27 wd:Q159 } # country of citizenship Russia
</source>
=== Сортировка ===
*Поиск персон, у которых в "occupation" указанo "mathematician" и сортировка по "field of work"
[https://query.wikidata.org/#SELECT%20%3Ffield_of_workLabel%20%28COUNT%28%3Fitem%29%20AS%20%3Fcount%29%0AWHERE%0A%7B%0A%20%20%20%3Fitem%20wdt%3AP106%20wd%3AQ170790%20.%20%23%20occupation%20is%20%27mathematician%27%0A%20%20%20%3Fitem%20wdt%3AP101%20%3Ffield_of_work.%0A%09SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22en%22.%20%7D%0A%7D%0AGROUP%20BY%20%3Ffield_of_workLabel%0A%0A SPARQL query]
*Поиск персон, у которых в "occupation" указанo "mathematician" и сортировка по "occupation" (т.е. чем они занимались помимо "mathematician"):
[https://query.wikidata.org/#SELECT%20%3FoccupLabel%20%28COUNT%28%3Fitem%29%20AS%20%3Fcount%29%0AWHERE%0A%7B%0A%09%20%3Fitem%20wdt%3AP106%20wd%3AQ170790%20.%20%23%20occupation%20is%20%27mathematician%27%0A%20%20%09%20%3Fitem%20wdt%3AP106%20%3Foccup.%0A%09%20SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22en%22.%20%7D%0A%7D%0AGROUP%20BY%20%3FoccupLabel%0A%0A SPARQL query]
=== Сортировка по "field of work" ===
<source lang="SPARQL">SELECT ?field_of_workLabel (COUNT(?item) AS ?count)
WHERE
{
?item schema:description "Russian mathematician"@en.
?item wdt:P101 ?field_of_work.
SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}
GROUP BY ?field_of_workLabel
</source>
[https://query.wikidata.org/#SELECT%20%3Ffield_of_workLabel%20%28COUNT%28%3Fitem%29%20AS%20%3Fcount%29%0AWHERE%0A%7B%0A%09%3Fitem%20schema%3Adescription%20%22Russian%20mathematician%22%40en.%0A%20%20%09%3Fitem%20wdt%3AP101%20%3Ffield_of_work.%0A%09SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22en%22.%20%7D%0A%7D%0AGROUP%20BY%20%3Ffield_of_workLabel%0A%0A SPARQL query]
== Близость наук ==
'''Дано:''' <br />
* Математические предметы а и b;
* S(a,b) - число ученых, занимающихся предметами a и b;
* f(a) - число ученых, занимающихся предметом а;
* f(b) - число ученых, занимающихся предметом b.<br />
'''Доказать:'''<br />
* S(a,b) не является метрикой.
* S(a,b) < f(a)+f(b)
* S(a,b) ≤ min(f(a),f(b))
<br />
'''Необходимо:'''<br />
* Список наук и количество занятых в них ученых.<br />
В мире:
[https://query.wikidata.org/#SELECT%20%3Ffield_of_workLabel%20%28COUNT%28%3Fitem%29%20AS%20%3Fcount%29%0AWHERE%0A%7B%0A%20%20%20%3Fitem%20wdt%3AP106%20wd%3AQ170790%20.%20%23%20occupation%20is%20%27mathematician%27%0A%20%20%20%3Fitem%20wdt%3AP101%20%3Ffield_of_work.%0A%09SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22en%22.%20%7D%0A%7D%0AGROUP%20BY%20%3Ffield_of_workLabel%0A%0A SPARQL query].<br />
В России:
[https://query.wikidata.org/#SELECT%20%3Ffield_of_workLabel%20%28COUNT%28%3Fitem%29%20AS%20%3Fcount%29%0AWHERE%0A%7B%0A%09%3Fitem%20schema%3Adescription%20%22Russian%20mathematician%22%40en.%0A%20%20%09%3Fitem%20wdt%3AP101%20%3Ffield_of_work.%0A%09SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22en%22.%20%7D%0A%7D%0AGROUP%20BY%20%3Ffield_of_workLabel%0A%0A SPARQL query].<br />
* Пересечения этих наук по персонам
Рассмотрим на конкретном примере: возьмем такие field of work как "probability theory" (Q5862903) и "graph theory" (Q131476) и выведем список математиков, которые были заняты в этих областях:
[https://query.wikidata.org/#SELECT%20%20%3Flabel%20%3Fperson%0AWHERE%0A%7B%0A%09%3Fperson%20wdt%3AP101%20wd%3AQ5862903.%20%23field%20of%20work%20is%20probability%20theory%0A%09%3Fperson%20wdt%3AP101%20wd%3AQ131476.%20%23field%20of%20work%20is%20graph%20theory%0A%20%20%09%3Fperson%20rdfs%3Alabel%20%3Flabel.%0A%20%20%20%20FILTER%28LANG%28%3Flabel%29%20%3D%20%22en%22%29%0A%7D%0A SPARQL query] 3 Results<br />
<br />
Возьмем наиболее популярные области в математике во всём мире и составим всевозможные попарные их комбинации, чтобы посмотреть чему равна величина S(a,b), где a и b рассматриваемые науки. Результаты можно увидеть в таблице:<br />
[[Файл:Number of scholars sharing math fields.jpg|мини|слева]]
<br />
<br />
'''Пояснения к таблице:'''<br />
В ячейке желтого цвета число слева означает, что 11 человек занимаются одновременно предметом T(топология) и предметом GpT(теория графов) во всём мире(М), а число справа в этой же ячейке означает, что всего 1 человек в России(Р) занимается этими предметами одновременно. То есть, в мире S(a, b) = 11. В России S(a, b) = 1.<br />
f(n) - число ученых, занимающихся предметом n.<br />
На главной диагонали стоит сумма пересечений какой-либо науки со всеми остальным.<br />
Голубым цветом отмечено число пересечений больше 20.<br />
'''Некоторые выводы:'''<br />
* Наиболее изучаемой областью во всём мире является теория чисел. В России - математический анализ.
* Среди математиков, занимающихся теорией чисел, наиболее популярны такие области как математический анализ (35 человек в мире, из них 17 из России), комбинаторика (23 в мире) и алгебра(35 в мире, из них 23 из России).
* Изучающие математический анализ, также изучают теорию вероятностей (27 человек в мире, из них 19 из России), геометрию (20 человек в мире, их них 9 из
России), дифференциальные уравнения (33 человека и все они из России), функциональный анализ (37 в мире и только 10 из России) и теорию функций(21 человек, все из России).
* Математики, изучающие топологию, скорее всего занимаются и геометрией (20 человек в мире, 9 из России).
* Среди математиков, занимающихся комбинаторикой, 31 человек в мире занимается теорией графов и только 4 из России.
* Среди тех, кто занят в области геометрии 29 человек в мире и 22 человека из России заняты и в области алгебры.
*
*
* Наибольшее число пересечений со всеми областями во всём мире у такой науки как математический анализ, а в России у дифференциальный уравнения.
* Меньше всего пересечений со всеми областями (наименее изучаемые с другими науками) во всём мире и в России: математическая логика, теория множеств,алгебраическая геометрия, теория графов и теория групп.
* Теория графов пересекается с другими областями во всём мире 54 раза, а в России всего 7.
* Комбинаторика пересекается с другими областями во всём мире 111 раз, а в России всего 32.
; Визуализация ([[w:en:Gephi|Gephi]])
Дать пример формата файла с графом:
* вершины - названия наук,
* ребро указывает на существование учёных, занимающихся двумя науками (вершины, инцидентные ребру); сила связи (вес ребра) - число таких учёных.
==Рейтинг ученых==
1. Напишем SPARQL-запрос, который выводит список математиков и количество изучаемых ими наук:
<source lang="SPARQL">SELECT ?itemLabel (COUNT(?field_of_work) AS ?count)
WHERE
{
?item schema:description "Russian mathematician"@en.
?item wdt:P101 ?field_of_work.
SERVICE wikibase:label { bd:serviceParam wikibase:language "ru". }
}
GROUP BY ?itemLabel
</source>
[https://query.wikidata.org/#SELECT%20%3FitemLabel%20%28COUNT%28%3Ffield_of_work%29%20AS%20%3Fcount%29%0AWHERE%0A%7B%0A%09%3Fitem%20schema%3Adescription%20%22Russian%20mathematician%22%40en.%0A%20%20%09%3Fitem%20wdt%3AP101%20%3Ffield_of_work.%0A%09SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22ru%22.%20%7D%0A%7D%0AGROUP%20BY%20%3FitemLabel%0A%0A SPARQL query]<br />
<br />
Запрос, выводящий список математиков, которые занимались только одной математической наукой. Рассмотрим на конкретном примере: возьмем "number theory":
[https://query.wikidata.org/#SELECT%20%3Fperson%20WHERE%20%7B%0A%20%20%3Fperson%20schema%3Adescription%20%22Russian%20mathematician%22%40en.%0A%20%20%3Fperson%20wdt%3AP101%20%3Ffield.%0A%20%20%3Fperson%20wdt%3AP101%20wd%3AQ12479.%0A%20%20SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22en%22.%20%7D%0A%7D%0AGROUP%20BY%20%3Fperson%0AHAVING%20%28%28COUNT%28%3Ffield%29%29%20%3D%201%29%0A SPARQL query] 12 Results<br />
2. Построим гистограмму, отражающую число ученых с числом "field of work" = n, где n - количество изучаемых предметов одной персоной:<br />
<br />
[[Файл:The number of scientists and the number of objects.jpg|мини|слева]]
<br /><br /><br /><br /><br /><br /><br /><br /><br />
Причем, среди 424 человек в первом столбце у 101 человека в свойстве "field of work" указано просто "mathematics"<br />
Такую же гистограмму построим и для математиков всего мира:<br />
[[Файл:The number of scientists and the number of objects in the world.jpg|мини|слева]]<br /><br /><br /><br /><br /><br /><br /><br /><br />
Посмотрим процентное соотношение ученых, изучающих определенное количество наук от общего числа ученых в России и в мире:<br />
[[Файл:The percentage of scientists studying a certain amount of Sciences of the total number of scientists.jpg|мини|слева]]<br /><br /><br /><br /><br /><br /><br /><br /><br />
'''Выводы, которые можно сделать на основе трех полученных гистограмм:'''<br />
# В мире и в России большая часть ученых занимается только одной наукой.
# Чем больше наук, тем меньше занятых в них ученых.(?)
# 6, 9, 11 и 12 науками занимаются российские математики.
# 3, 4, 5 и 7 науками занимаются в основном математики из России.
# Если сложить все процентные результаты, то можно увидеть, что примерно у 25% математиков мира не указаны научные области/область.
# Процент ученых, занятых в одой области в мире больше чем в России, с остальным количеством областей наоборот.
== Ссылки ==
* Finn Årup Nielsen. [https://finnaarupnielsen.wordpress.com/2016/05/10/occupations-of-persons-from-panama-papers/ Occupations of persons from Panama Papers] // Blog. May 10, 2016. (Упорядочение множества персон (график Bubble) по их занятиям).
* Finn Årup Nielsen. [https://finnaarupnielsen.wordpress.com/2016/09/30/the-wikidata-scholarly-profile-page/ The Wikidata scholarly profile page] // Blog. September 30, 2016. (Обзор свойств Викиданных для описания персоны учёного).
* Elvira Kuznetsova (2017): The graph of the proximity of sciences to world scientists. figshare. DOI:[https://doi.org/10.6084/m9.figshare.4609495.v4 10.6084/m9.figshare.4609495.v4].
3t63woual7gch1ee9q5nnk0tahuguf8
Участник:Антипус/Книги/питон
2
27572
150437
2022-08-09T08:47:54Z
Антипус
31817
Новая страница: «{{сохранённая_книга | setting-papersize = a4 | setting-toc = auto | setting-columns = 1 }} == питон == :[[Программирование и научные вычисления на языке Python/§1]] :[[Программирование и научные вычисления на языке Python/§2]] :[[Программирование и научные вычисления на языке Python/§3]] :Программи...»
wikitext
text/x-wiki
{{сохранённая_книга
| setting-papersize = a4
| setting-toc = auto
| setting-columns = 1
}}
== питон ==
:[[Программирование и научные вычисления на языке Python/§1]]
:[[Программирование и научные вычисления на языке Python/§2]]
:[[Программирование и научные вычисления на языке Python/§3]]
:[[Программирование и научные вычисления на языке Python/§4]]
:[[Программирование и научные вычисления на языке Python/§5]]
:[[Программирование и научные вычисления на языке Python/§6]]
:[[Программирование и научные вычисления на языке Python/§7]]
:[[Программирование и научные вычисления на языке Python/§8]]
:[[Программирование и научные вычисления на языке Python/§9]]
:[[Программирование и научные вычисления на языке Python/§10]]
:[[Программирование и научные вычисления на языке Python/§11]]
:[[Программирование и научные вычисления на языке Python/§12]]
:[[Программирование и научные вычисления на языке Python/§13]]
:[[Программирование и научные вычисления на языке Python/§14]]
:[[Программирование и научные вычисления на языке Python/§15]]
:[[Программирование и научные вычисления на языке Python/§16]]
:[[Программирование и научные вычисления на языке Python/§17]]
:[[Программирование и научные вычисления на языке Python/§18]]
:[[Программирование и научные вычисления на языке Python/§19]]
[[Категория:Книги|питон]]
li9o0b678ytdlt3hz6ochxm2y3shpwc