Три измерения (время) вложены в Networkpartners (NP), которые вложены в Persons (ID). Переменная NP.T (созданная в соответствии с упомянутым ответом здесь) указывает количество Networkpartners (без пропущенного значения в Результате), которое есть у конкретного человека (ID) по конкретному измерению (от 1 до 3).
Это пример для моего набора данных, хотя в реальном наборе тысячи строк.
ID NP Time Outcome NP.T
1 1 11 1 4 2
2 1 12 1 2 2
3 1 11 2 3 2
4 1 12 2 3 2
5 1 11 3 NA 1
6 1 12 3 3 1
7 2 21 1 2 2
8 2 22 1 4 2
9 2 21 2 NA 1
10 2 22 2 4 1
11 2 21 3 NA 1
12 2 22 3 4 1
Я хочу рассчитать следующие вещи и не знаю, как это сделать правильно:
а) Среднее SD для количества сетевых партнеров при каждом измерении (NP.T).
Также меня интересует количество лиц (идентификаторов), которые назвали хотя бы одного сетевого партнера при каждом измерении.
T1 -> 2 идентификатора с именем хотя бы одного сетевого партнера
T2 -> 2 идентификатора с именем хотя бы одного NP
T3 -> 2 идентификатора с именем хотя бы одного NP
В этом примере это может показаться тривиальным, но не в моем примере. для расчета средств, sds ect. каждый раз я хочу учитывать только те идентификаторы, которые фактически назвали хотя бы одного сетевого партнера в это конкретное время. Идентификаторы, которые не назвали ни одного NP в это конкретное время, не должны быть частью описательной статистики для этого момента времени. Для уточнения: если в выходной переменной есть NA, это означает, что этот NP не был назван своим идентификатором в тот момент времени.
б) повторно измеряет ANOVA, чтобы выяснить, изменяется ли среднее число сетевых партнеров с течением времени.
некоторые ожидаемые результаты:
Среднее значение T1 = 2 ‹-, поскольку оба идентификатора назвали два NP в T1.
Среднее значение T2 = 1,5 ‹, так как один ID назвал два, а другой один NP в T2
Mean.T3 = 1 ‹- так как оба ID назвали один NP на T3
n.T1 = 2
n.T2 = 2
n.T3 = 2
Проблема в том, что в реальном наборе данных все люди назвали разное количество Networkpartners, поэтому я не знаю, как рассчитать описательную статистику в этом случае.
nobs=sum(NP.T))
. Где ты это взял? 04.08.2013