Il suffit d'exporter toutes les valeurs de l'attribut (par exemple relevance), soit pour MongoDB :

mongoexport -d verbatims -c verbatim \
   --query='{"missionId": ObjectId("5200e62ae4b08a85995c9b08")}' \
   -f relevance \
   --csv --slaveOk=true \
   --out=relevance-mission-5200e62ae4b08a85995c9b08.csv

... puis calculer dans R la distribution de cet attribut grâce à la fonction density :

d <- read.table("relevance-mission-5200e62ae4b08a85995c9b08.csv", header=T, sep=",")
plot(density(d))

Distribution des valeurs d'un attribut

... et potentiellement pour pousser un peu la réflexion, comparer la distribution en histogrammes des valeurs de l'attribut avec la distribution normale :

# Histograms with Normal Curve
# http://www.statmethods.net/graphs/density.html
r <- d$relevance
h <- hist(r, breaks=20)
xfit <- seq(min(r), max(r), length=40)
yfit <- dnorm(xfit, mean=mean(r), sd=sd(r))
yfit <- yfit*diff(h$mids[1:2])*length(r)
lines(xfit, yfit, col="blue", lwd=2)

Comparaison de la distribution des valeurs par rapport à la distribution normale