-
Notifications
You must be signed in to change notification settings - Fork 0
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
weergeven van exacte aantallen en/of intervallen: wat als beide voorkomen? #92
Comments
@leymanan toegewezen omdat ik een reactie verwacht. |
Ik denk niet dat men de 2 getallen gaat optellen, dus best beide weergeven |
Ik zou één afgeleide variabele maken die gebaseerd is op beide mogelijkheden en daarmee verder gaan. |
zie dus ook de PR! (daar ben ik bijna mee rond) |
Ok, even checken of ik het juist begrepen heb. Dus ingeval van een mix van exacte getallen en intervallen, geef ik het totaal weer in |
Om het nog een beetje te kaderen. Ik ben nog eens in oude code gaan kijken, en daar hadden we in de load_functie een min/max/mean _number_of_trees die afgeleid werd van de aantalsklasse of van het exact aantal.
Dat vond ik wel OK. Daar had je dus wel nog min en max als de gegevens geaggregeerd waren in de calc-functies. In de nieuwe code worden volgende variabelen berekend
Dan kan je niet rekenen over beide heen, dus we hebben één waarde nodig die ingevuld is voor allebei. |
Dus:
Voor In geval van de exacte waarde: lci en uci waarde NA geven omdat een BI geen zin heeft voor exacte waarden? |
Inderdaad
OK!
BI inderdaad geen zin bij exacte waarden, maar dan toch wel bij de combinatie van exacte waarden en intervallen? |
Jaja, BI is dan uiteraard wel enkel gebaseerd op de onzekerheid van de intervallen (want de exacte getallen hebben geen BI nodig), maar ik ga de exacte waarden hierbij optellen zodat mean en lci en uci het volledige resultaat weergeven
Euh, ik wou dit toepassen voor alles waar (gedeeltelijke) interval-gegevens geaggregeerd worden. Dus voor regeneratie gaat dat idd. onder andere over plotniveau (en plot_height,...)
Daar kiest een gebruiker zelf wat hij/zij doet. Er is in elk geval een optie om voor variabelen intervallen in te geven met min en max, en dan wordt hier dezelfde rekenmethode toegepast. Dit is geïllustreerd met een bv. van bedekking.
Een rekenmethode startend van een gemiddelde met BI is niet voorzien in |
In verband met m'n laatste opmerking: dat lukt inderdaad, ik bereken de variantie uitgaande van het idee dat de min-max een BI is, dus je kan hier evengoed een BI met lci en uci meegeven. Nota aan zelf: na het in orde brengen van de berekeningen de tabel class_data.csv nog aanvullen met alle lci en uci die in forresdat komen! |
Als afgesproken heb ik in
load_data_regeneration()
een onderscheid gemaakt tussen de exact getelde aantallen (nr_of_regeneration
) en de aantallen die geschat zijn door een interval (min/max/mid_number_of_regeneration
) (commit e160246). Maar bij het aanpassen van decalculate
-functies die deze gegevens gebruiken, merkte ik dat soms beide (exact aantal en schatting) opgegeven zijn voor eenzelfde record, en soms is binnen eenzelfde plot, periode en hoogteklasse voor bv. verschillende soorten een verschillende methode gebruikt is (aantal of schatting). Hoe ga ik hier best mee om?load_data_regeneration()
: geef ik hier beiden weer als ze beiden in de databank staan?calculate
-functies) kunnen kiezen welke gegevens we willen gebruikencalculate
-functies:load_data_regeneration()
weergegeven zijn, welke kies ik voor de berekeningen? Altijd het exacte getal, of liever het interval gebruiken als voor de andere records binnen de groep ook het interval gegeven is? (Te beslissen samen met volgende vraag.)nr_of_regeneration_ha
als het interval met o.a.mean_number_of_regeneration_ha
, maar in tegenstelling totload_data_regeneration()
zou het hier wel gaan over getallen die opgeteld moeten worden om het totaal te krijgen (dus beide behouden zowel hier als bijload_data_regeneration()
zou ik zeker niet doen). De andere optie is om de volledige som weer te geven onder het interval ennr_of_regeneration_ha
de waarde NA te geven.(Dit issue is aangemaakt n.a.v. het herwerken van de functie
calculate_regeneration_plot_height()
en het is nog niet duidelijk of het tweede deel voor allecalculate
-functies van toepassing is. In elk geval lijkt het zinvol om hier een generieke keuze te maken en dit voor alle functies op te vangen, ook al zijn er nog niet voor alle functies concrete voorbeelden van gemixte groepen.)The text was updated successfully, but these errors were encountered: