Ну и, если честно, то да, я согласен, что на больших обьёмах данных быть статистиком легко, просто и приятно. Можно даже применять методы, имеющие незначительное отношение к статистике, типа того же SVM, не говоря уже про нейросети, совершенно не уделяя времени анализу того, насколького справедливы твои выводы; завтра прийдёт новый гигабайт данных, на которых легко получить test set. Или ещё один training set, если с test set не срослось.
В то же время, мне хотелось бы отметить, что в ряде случаев применить что-то нейросетевое крайне затруднительно - просто потому, что измерений мало, и они, сцуко, дорогие. Поэтому по факту за последние лет 10 я наблюдаю только расхождение тех методов, которые используются в клинических исследованиях и при анализе показа баннеров большими интернет-компаниями.
no subject
Ну и, если честно, то да, я согласен, что на больших обьёмах данных быть статистиком легко, просто и приятно. Можно даже применять методы, имеющие незначительное отношение к статистике, типа того же SVM, не говоря уже про нейросети, совершенно не уделяя времени анализу того, насколького справедливы твои выводы; завтра прийдёт новый гигабайт данных, на которых легко получить test set. Или ещё один training set, если с test set не срослось.
В то же время, мне хотелось бы отметить, что в ряде случаев применить что-то нейросетевое крайне затруднительно - просто потому, что измерений мало, и они, сцуко, дорогие. Поэтому по факту за последние лет 10 я наблюдаю только расхождение тех методов, которые используются в клинических исследованиях и при анализе показа баннеров большими интернет-компаниями.