Start
 

Aldfaer

Hét gratis stamboomprogramma

U bent op pagina StartForumSjablonenUitzoeken dubbelen
.

Uitzoeken dubbelen


  Posten niet toegestaanPage: « < 1 of 1 > »
30 Nov 2010 - 12:3318012
Uitzoeken dubbelen

Sjabloon :Bonus-uitzoeken-dubbelen kan bij "Geef het gewenste rapport aan" de keuzen niet gecummeleerd worden ? Momenteel krijgt men rapporten met zoveel normale dubbele gegevens dat de echte dubbele personen in de maasa niet tot uiting komen !
Victor



__________________
Victor Vanhouche
30 Nov 2010 - 13:2518013

Dag Victor,

ik heb me bij het schrijven van dit sjabloon laten leiden door de wijze van Aldfaer. Daar kun je een persoon uitsluiten van controle, waardoor je deze niet meer op de lijst terugziet.

Ik heb dat fenomeen uitgebreid tot een uitsluiting per soort. Daarvoor moet je een overig feit invoeren. De help gaat daar uitgebreid op in.

De lijst met dubbelen lijkt me ook niet zo fraai om die te cumuleren; puur alleen al om reden dat de lijst nóg langer wordt.

Ik wil wel overwegen om aan de lijsten een extra filter mee te geven. Dat filter zou dan een persoon alleen als dubbel aanmerken als naast de gebeurtenisdatum ook de familienaam gelijk is.
Nadeel van de naamsvergelijking is dat de schrijfwijze wel eens net iets anders kan zijn. Voor het vergelijk neem ik dan de sorteer als naam.

Per saldo zie je dan de dubbelen waaronder tweelingen.



__________________
Han
01 Dec 2010 - 18:4718036

Hallo Han
Heb terug mijn bestand ca 21000 personen gecontroleerd op dubbel namen en gestart met het toevoegen van een overig feit Dubbel-naam ! het controle resultaat gaf 3373 personen. Een analyse van een aantal ca 86 betrokken personen geeft :
- 2 echte dubbels, opgelost door verwijdering !
-39 opgelost met toevoeging van het overige feit met als achtergrond :
. 24x concreet verschil in geboortedatum (of jaar)
. 5x hergebruik van naam na overlijden van kind in een gezin ( is meestal ook met verschil in geboortedatum)
. 7x relatie vader zoon :zoon heeft zelfde voornaam als vader! en hier zijn er dikwijls geen geboortedatum van vader !
. 1x relatie meter als oudtante moederszijd dopeling; dergelijke meter/peter relaties zullen er meer voorkomen !
; 2x verschil in ouders, zonder datums

Dit is wel een tijdrovende bezighied ! Die bijkomende filter zal dus heel wat oplossen !

Bijkomend voorstel: is het mogelijk de kolommen Vader / Moeder naast deze van geboorte (gedoopt) te plaatsen en de kolom laatste partner smaller te maken ? Weet wel dat het rapport kan geopend worden in exel waarbij men een eigen schikking kan door voeren Maar dan is de Jumplink weg en deze is absoluut nodig bij de analyse !

Victor



__________________
Victor Vanhouche
01 Dec 2010 - 19:2518037

Victor,

dubbelen uitzoeken is best een flinke bezigheid die het beste gedaan kan worden met een biertje in de ene hand en met de andere kan nog gescrold worden.

In ieder geval is het u nu gelukt om een aantal echte dubbelen er uit te vissen en een ander aantal van een volgende controle op geboortedatum uit te sluiten.

Ik zal tevens met uw wens rekening houden.



__________________
Han
01 Dec 2010 - 22:0318038

Ja,

Het is net wat Han zegt:
Biertje erbij en scrollen.
Ik gebruik dit sjabloon bijna om de 2 weken.
Voor ons onderzoek waar we met diverse mensen gegevens toevoegen aan een bestand van 85.000 namen, weten we soms niet van elkaar wat we ingevoerd hebben.
Ik zoek daarom op dubbele code, geboorte, huwelijk en overlijden.
Dit kost me 1 avondje en een paar pilsjes.......maar het werkt PRIMA.

Guus



__________________
"van Deursen 8000" en Gemert.....
04 Dec 2010 - 19:0718061

Hallo Han
Heb nu een test gedaan met Dubbel_Geb , het rapport gaf 139 personen waarvan 4x echte dubbels (dus 8 personen); 20x overig feit Dubbel-Geb met inhoud:tweeling ingevoerd (dus 40 personen) en 45x het overig feit met inhoud:ouders verschillend (dus 90personen)! Dus het rendement van de zoekfunctie naar dubbele personen ligt zeer laag !
Daarom kom ik terug op je voorstel:
"Ik wil wel overwegen om aan de lijsten een extra filter mee te geven. Dat filter zou dan een persoon alleen als dubbel aanmerken als naast de gebeurtenisdatum ook de familienaam gelijk is".
Dit lost wel de meldingen op met de inhoud:ouders verschillend ! Maar niet de tweelingen, zoals je trouwens zelf reeds melde ! Nu Tweelingen kunnen die niet uitgefilterd worden op basis van voornaam en of uit het feit dat ze uit het zelfde gezin komen: gelijke ouders hebben ?
Heb ook ondervonden dat een persoon die uitgefilterd was voor Dubbel-Naam, toch voorkomt bij test op Dubbel-Geb !
Als ik dus goed begrijp moet men voor al de gebeurtenissen : gelijke naam,geboorte, overlijden, relatie en code een overig feit maken ?
Wat met de personen die reeds op tabblad diversen uitgesloten zijn voor controle ?

Victor



__________________
Victor Vanhouche
05 Dec 2010 - 23:0918075
Quote vicvanhouche:

Heb nu een test gedaan met Dubbel_Geb , het rapport gaf 139 personen waarvan 4x echte dubbels (dus 8 personen); 20x overig feit Dubbel-Geb met inhoud:tweeling ingevoerd (dus 40 personen) en 45x het overig feit met inhoud:ouders verschillend (dus 90personen)! Dus het rendement van de zoekfunctie naar dubbele personen ligt zeer laag !

Victor,
de vraag is of je die 4 echte dubbels ook op een andere manier had gevonden dan het vergelijk op geboortedatum; die 4 echte dubbels heb je dus blijkbaar niet op een andere manier gevonden, zoals het zoeken naar dubbelen op naam.

Trouwens, als je 'dubbelen' hebt die niet echt dubbel zijn, dan hoef je er maar één aan te merken om buiten de controle te komen.

Het feit dat ik niet het Aldfaer Diversen 'uitsluiten van controle' gebruik is dat alle checks dan niet meer opgaan. Stel voor dat naderhand toch iemand weer gekoppeld wordt aan die persoon terwijl dat fout is , dan vind je dat nooit meer.

Maar, ik wil best ook de keuze inbouwen dat personen die in Aldfaer aangemerkt zijn als 'uitsluiten van controle' ook voor dit sjabloon uitgesloten worden. Let wel dat de gebruiker het zelf moet aangeven.



__________________
Han
07 Dec 2010 - 12:4818099

Han
die 4 echte dubbels, gezien ik ze verwijderd heb, kan ik niet meer hertesten met instelling gelijke naam ! Ben nu verder gaan testen op gelijke geboortedatum en weer enkele echte dubbels gevonden. De test hernomen nu met gelijkenaam; Maar ze werden niet vermeld ! Waarschijnlijk door het te kleine verchil in schrijfwijze naam ! vb
Dutron Irma Marie Josefe Eugûnie en Dutron Irma Marie Joséphe Eugénie !
Denkelijk is zo iets niet optelossen !!
Maar als je met je bijkomende filters zou kunnen rekening houden met herbruik van de voornaam in een zelfde gezin; met meerlingen waarbij de voornaam steeds een verschil heeft; met ouders verschil bij gelijke geboorte datums ! zouden de lijsten alheel wat korter en efficienter worden ! Weet natuurlijk niet of dit sjabloon technisch mogelijk is ?
Als me kan instellen dat de uitgesloten kontrole van tabblad diversen mee in rekenig wordt gehouden is dit ook een stap in de goede richting.
Victor



__________________
Victor Vanhouche
21 Dec 2010 - 14:5318289

Victor,

de patiënt ligt nu eindelijk op de tafel om de gewenste code in te brengen maar ik kom tot mijn schrik tegen dat er geen Tag bestaat om in Aldfaer na te gaan of van tabblad Diversen 'Uitsluiten van controle' het vakje wel/niet aangevinkt is.

Via de GEDCOM Tag _NOCHECK kom je daar wel achter maar daar heb je niets aan.

Ik stel daarom voor dat een Overig feit met de categorienaam 'Nocheck' hetzelfde gaat doen als Aldfaer. Die persoon wordt dus van alle controles per soort uitgesloten, zowel in het sjabloon Gegevenscontrole als bij de Dubbelen.
Zoals u weet kan het Uitsluiten wel/niet per sjabloon toegepast worden.

Het aardige van deze categorie 'Nocheck' is dan tegelijk dat er een lijstje komt van uitgesloten personen; op te vragen via het sjabloon 'Alle feiten'



__________________
Han
23 Dec 2010 - 12:1318314

Hallo Han
Ben het aan het uittesten. Maar als ik nu goed begrijp moet ik bij “controle gegevens” mogelijke dubbele personen , de niet dubbels, één ervan, bij diversen uit sluiten van controle en een bijkomend overig feit, categorie Nocheck, invoeren ! Met mijn huidige DB wil dit zeggen bij 152 personen ! Kan natuurlijk me wel gaan beperken tot één van de twee controle systemen : controle gegevens of het sjabloon dubbels ! Maar gezien het sjabloon nu nog zoveel mogelijke dubbels voorstelt die niet dubbel zijn ben ik er geen voorstander van dit regelmatig te gebruiken !
Nu wilde ik even nagaan wat de mogelijkheden zijn van het sjabloon “Alle feiten” met o.a. instelling :”feiten zonder inhoud” ! Maar ondervind dat na aanvinken : “feiten zonder inhoud “ en “Verander de selectie, is nu nageslacht persoon” er geen dialoog vensters komen !rapport start direct en geeft steeds het zelfde resultaat : Vanhouche Christophe I Facebook I
Nu deze persoon hehoort niet tot het nageslacht van de persoon in het hoofd scherm en de inhoud van het van het feit is niet leeg ! Het is wel een koppeling <nt><a href”webadres”> een benaming</a></nt> !maar er staan er zo veel bij verschillend personen !
Begrijp niet wat er gebeurd ! Heb reeds de gecrieerde rapportmap “Alle feiten “verwijderd maar het probleem blijft! Eenmaal heb ik de dialoog vensters wel gehad, ingesteld op volledig bestand,het controle rapport was toen ook al het zelfde ! Nu dacht ik aan het cfg bestand van het sjabloon, dit verwijderd, kreeg nu wel het tussen venster i.v.m? eerste maali maar nu ook nog bleef het probleem !
Victor



__________________
Victor Vanhouche
23 Dec 2010 - 13:4418317
Quote vicvanhouche:
Maar als ik nu goed begrijp moet ik bij “controle gegevens” mogelijke dubbele personen , de niet dubbels, één ervan, bij diversen uit sluiten van controle en een bijkomend overig feit, categorie Nocheck, invoeren !

Victor, u kunt straks hetzelfde systeem volgen als bij Aldfaer, dus een overig feit 'Nocheck' invoeren bij een persoon en dan wordt die bij de sjablonen uitgesloten (als u dat tenminste aangeeft)van ALLE deelcontroles. Het blijft mogelijk om de deelcontrole uit te voeren zoals voorheen.

Quote vicvanhouche:

Met mijn huidige DB wil dit zeggen bij 152 personen ! Kan natuurlijk me wel gaan beperken tot één van de twee controle systemen : controle gegevens of het sjabloon dubbels ! Maar gezien het sjabloon nu nog zoveel mogelijke dubbels voorstelt die niet dubbel zijn ben ik er geen voorstander van dit regelmatig te gebruiken !

Het sjabloon Dubbel is in het leven geroepen om deelsegmenten uit te voeren, dus gerichte controles. U bent begonnen met de NAAMdubbele en dat is in het rijtje de laatste keuze, omdat het een controle is op dubbele namen en dan krijgt u die ook. Verstandiger is om vanaf het eerste rapport te beginnen met een spreiding van 2 dagen. Ik heb inmiddels de naamcontrole ingebouwd waardoor dus bij een datumcontrole OOK naar de 'sorteer als' naam wordt gekeken.
De keuze NAAMdubbel gebruik ik ook niet want ik krijg uit mijn bestand (20.000) 4277 personen, maar voor een klein bestand werkt het wel.

Quote vicvanhouche:

Nu wilde ik even nagaan wat de mogelijkheden zijn van het sjabloon “Alle feiten” met o.a. instelling :”feiten zonder inhoud” ! Maar ondervind dat na aanvinken : “feiten zonder inhoud “ en “Verander de selectie, is nu nageslacht persoon” er geen dialoog vensters komen !rapport start direct en geeft steeds het zelfde resultaat : Vanhouche Christophe I Facebook I
Nu deze persoon hehoort niet tot het nageslacht van de persoon in het hoofd scherm en de inhoud van het van het feit is niet leeg ! Het is wel een koppeling <nt><a href”webadres”> een benaming</a></nt> !maar er staan er zo veel bij verschillend personen !
Begrijp niet wat er gebeurd ! Heb reeds de gecrieerde rapportmap “Alle feiten “verwijderd maar het probleem blijft! Eenmaal heb ik de dialoog vensters wel gehad, ingesteld op volledig bestand,het controle rapport was toen ook al het zelfde ! Nu dacht ik aan het cfg bestand van het sjabloon, dit verwijderd, kreeg nu wel het tussen venster i.v.m? eerste maali maar nu ook nog bleef het probleem !
Victor

Het sjabloon Alle feiten wordt wellicht niet goed begrepen.
De dialoogkeuze 'Controleer bestand op feiten zonder inhoud' trekt zich niets aan van andere vragen over feitselecties of deelselecties van het bestand. Het sjabloon neemt het volledige bestand en gaat alle feiten af.

Het tweede punt is dus geheel anders van aard en heeft niets met 'lege feiten' te maken. Zoals eerder opgemerkt kan het zijn dat deze persoon deel uitmaakt (schoon-familie-ouders?) van het nageslacht. Net als bij het Aldfaer nageslachtsjaboon wordt daar dus wel tekstueel naar gerefereerd.



__________________
Han
23 Dec 2010 - 13:5118318

Victor,

ik zal u het nieuwe sjabloon als pre-release sturen.



__________________
Han
29 Dec 2010 - 13:2318377

Hallo Han
Na toepasing van deze laatste versie van het sjabloon en een analys van de resultaten (zie hierna) blijf ik met volgende vragen om het aantal bijkomende overige feiten te beperken; is er een bijkomende uitfiltering mogelijk voor :
- tweelingen (meerlingen) opbasis verschil in voornaam en het zelfde ouderspaar ?
- bij gelijke datum geb/ovl op basis van ouderspaar verschillend ?
- hergebruik van voornamen in een zelfde gezin op basis verschil in datum geb ?
NB Voor de gevallen dat er toch een bijkomend overig feit moet gemaakt worden is het dan niet het eenvoudigste om categorie Nocheck te kiezen ? Het geen
bij elke instelling geb /ovl/rel/code/ naam werkt ?
En personen aangeduidt als uitsluiten controle bij diversen moeten die persoon per persoon het overig feit categorie Nocheck ingevoerd worden ?
Victor
Controle Dubbelen op DB 21178 personen
Met gelijke geb datum en namen : resultaat 200 personen : 100 te nemen acties
- 10x echte dubbels verwijderd 72x tweelingen -> overig feit – categorie Dubbel-geb (nog in te voeren !) 12x ouders verschillend -> overig feit – categorie Dubbel-geb 6x foutieve invoer -> verbeterd
Met gelijke ovl datum en namen : resultaat 60 personen : 30 te nemen acties
-6 x echte dubbels -> verwijderd 12x ouders verschillend -> overig feit – categorie Dubbel-ovl 5x foutieve invoer -> verbeterd 3x overleden tweelingen -> overig feit – categorie Dubbel-ovl 3x zus/broer relatie met °dat verschillend -> overig feit – categorie Dubbel-ovl 1x vader/kind relatie oorlog slachtoffers 1944 -> overig feit – categorie Dubbel-ovl
Met gelijke OT en relatie datums en namen : resultaat 16 relaties : 8 te nemen acties
-4x foutieve invoer -> verbeterd 2x 2 broers Xmet 2 zussen -> overig feit – categorie Dubbel-rel 2x 2 broers -> overig feit – categorie Dubbel-rel
Met gelijke naam : zonder uitsluitingen : 3371 personen en met : 3209
Dit zijn te grootte aantallen om acties per persoon uit tevoeren ! Daar zitten terug de tweelingen in en verschillende namen zonder data, meestal met relatie getuigen bij (peters en meters) !Deze laatsten worden ook bij de aldfaer controle gegevens: mogelijke dubbels gedetecteerd . Dus hiervoor zou dan een overig feit categorie Nocheck moeten voor ingevoerd worden ! op dit moment staan er reeds 360 zo ingesteld als uitsluiten bij controle bij Diversen !



__________________
Victor Vanhouche
29 Dec 2010 - 15:3418379
Quote vicvanhouche:

De opmerkingen van Victor zijn a.d.h.v. een pre-release (han)
Dus hiervoor zou dan een overig feit categorie Nocheck moeten voor ingevoerd worden ! op dit moment staan er reeds 360 zo ingesteld als uitsluiten bij controle bij Diversen !

zoals gemeld kan ik in de sjabloontaal NIET oppakken dat er al bij het tabblad diversen de persoon is uitgesloten voor totale controle. Spijtig genoeg.
Als u dat wilt toepassen voor het sjabloon Dubbelen (nieuwe versie) en Gegevenscontrole (nieuwe versie) dan gaat u eenvoudigweg naar Stamboom Onderhoud en wijzigt u de naam van Control-Cl naar Nocheck. En zo voor alle subcategorien.

Quote:

Hallo Han
Na toepasing van deze laatste versie van het sjabloon en een analys van de resultaten (zie hierna) blijf ik met volgende vragen om het aantal bijkomende overige feiten te beperken; is er een bijkomende uitfiltering mogelijk voor :
- tweelingen (meerlingen) opbasis verschil in voornaam en het zelfde ouderspaar ?
- bij gelijke datum geb/ovl op basis van ouderspaar verschillend ?
- hergebruik van voornamen in een zelfde gezin op basis verschil in datum geb ?

het wegfilteren (of wel/niet tonen) van tweelingen wordt behandeld in het sjabloon Gegevenscontrole en wel bij het onderwerp 'Moeders met 2 kinderen binnen 9 mnd'. Als u dus gebruik wilt maken van de categorie Nocheck dan zou u eerst dit aspect moeten afwerken en daarna het sjabloon Dubbelen.

Het wegfilteren bij hergebruik van dezelfde naam binnen een gezin ontneemt de kans op controle op een dubbel. Immers, daar kan een invoerfout zijn.

Quote:

Controle Dubbelen op DB 21178 personen
Met gelijke geb datum en namen : resultaat 200 personen : 100 te nemen acties
- 10x echte dubbels verwijderd 72x tweelingen -> overig feit – categorie Dubbel-geb (nog in te voeren !) 12x ouders verschillend -> overig feit – categorie Dubbel-geb 6x foutieve invoer -> verbeterd
Met gelijke ovl datum en namen : resultaat 60 personen : 30 te nemen acties
-6 x echte dubbels -> verwijderd 12x ouders verschillend -> overig feit – categorie Dubbel-ovl 5x foutieve invoer -> verbeterd 3x overleden tweelingen -> overig feit – categorie Dubbel-ovl 3x zus/broer relatie met °dat verschillend -> overig feit – categorie Dubbel-ovl 1x vader/kind relatie oorlog slachtoffers 1944 -> overig feit – categorie Dubbel-ovl
Met gelijke OT en relatie datums en namen : resultaat 16 relaties : 8 te nemen acties
-4x foutieve invoer -> verbeterd 2x 2 broers Xmet 2 zussen -> overig feit – categorie Dubbel-rel 2x 2 broers -> overig feit – categorie Dubbel-rel

Er zijn in ieder geval wel fouten gevonden en als u alle gegevens bij een persoon heeft gecontroleerd dan kunt u een Nocheck geven.
De controlelijsten kunt u altijd met/zonder Nocheck zien.

Quote:

Met gelijke naam : zonder uitsluitingen : 3371 personen en met : 3209
Dit zijn te grootte aantallen om acties per persoon uit tevoeren ! Daar zitten terug de tweelingen in en verschillende namen zonder data, meestal met relatie getuigen bij (peters en meters) !Deze laatsten worden ook bij de aldfaer controle gegevens: mogelijke dubbels gedetecteerd .

Met die aantallen ben ik het mee eens, ik zelf met een bestand van 20.000 gebruik deze keuze dan ook niet.



__________________
Han
03 Jan 2011 - 15:4918424

Hallo Han de beste wensen voor het nieuwe jaar


Quote:

het wegfilteren (of wel/niet tonen) van tweelingen wordt behandeld in het sjabloon Gegevenscontrole en wel bij het onderwerp 'Moeders met 2 kinderen binnen 9 mnd'. Als u dus gebruik wilt maken van de categorie Nocheck dan zou u eerst dit aspect moeten afwerken en daarna het sjabloon Dubbelen.

Het sjabloon Gegevenscontrole en wel bij het onderwerp 'Moeders met 2 kinderen binnen 9 mnd' Heb ik nu ook toegepast en heelwat invoer foutjes ontdekt en kunnen verbeteren !Is dus wel een positieve tijdrovende actie geweest maar er blijven wel 89 moeders met tweelingen over ! Dit wil dus zeggen dat ik minstens bij 89 kinderen een overig feit categorie Dubbel-geb of Nocheck zou moeten in voeren om bij de toepassing van sjabloon Dubbelen deze 178 personen uit te filteren !En van daar nogmaals mijn vraag of dit niet kan ingebouwd worden in het sjabloon dubbelen zelf ?


Quote:

Het wegfilteren bij hergebruik van dezelfde naam binnen een gezin ontneemt de kans op controle op een dubbel. Immers, daar kan een invoerfout zijn.


Hier kan ik je standpunt wel bijtreden !

Victor



__________________
Victor Vanhouche
03 Jan 2011 - 17:1918426

Tja,
het sjabloon "Dubbelen" bestond al toen zich een aangelegenheid voordeed om de Aldfaer Controle gegevens uit te breiden; maar dan vanuit een andere invalshoek.

Toen ben ik aan Gegevenscontrole begonnen en er niet bij stilgestaan dat het onderwerp "Moeders met meerdere kinderen binnen 9 mnd" toch ook wel eens onderdeel zou kunnen uitmaken van 'Dubbelen'. Je zou ook kunnen redeneren dat het sjabloon 'Dubbelen' in zijn geheel past in het sjabloon 'Gegevenscontrole'.

Ik zal om te beginnen in ieder geval in de help van het sjabloon 'Dubbelen' en 'Gegevenscontrole' er op wijzen dat er enige overlap aanwezig is.



__________________
Han
  Posten niet toegestaanPage: « < 1 of 1 > »

© Stichting Aldfaer - ingeschreven bij de KvK Noord-Nederland onder nr. 01096526