O método NM ou método Naszodi-Mendonça é uma operação que pode ser aplicada em estatística, econometria, economia, sociologia e demografia para construir tabelas de contingência contrafactuais . O método produz uma matriz ( ) que minimiza uma medida de distância face à matriz ( chamada tabela de origem) - ver definição de distância aplicada no método NM - , mas com os totais de linha e coluna de uma matriz de destino . Enquanto que os totais das linhas e os totais das colunas de são conhecidos, matriz em si pode ser desconhecida.

NM-method
Método NM

Como a solução para a matriz é única, o método NM é uma função: , onde é um vetor linha com todos os elementos iguais a um, com dimensão , enquanto é um vetor coluna de dimensão .

O método NM foi desenvolvido por Naszodi e Mendonça (2021) [1] (e aplicado pela primeira vez por Naszodi e Mendonca (2019) [2] ) para encontrar a matriz em problemas, onde a matriz não é uma amostra da população caracterizada pelos totais de linhas e totais de colunas da matriz , mas representa outra população .

A aplicação visava quantificar as mudanças intergeracionais sobre a homofilia educacional e, assim, medir a mudança histórica na desigualdade social entre diferentes grupos educacionais nos EUA entre 1980 e 2010. A tendência da desigualdade foi encontrada em forma de U, apoiando a visão de que com políticas sociais e económicas apropriadas a desigualdade pode ser reduzida.

Definição de rank de matriz editar

A proximidade entre duas matrizes com a mesma dimensão pode ser definida de várias maneiras. A distância euclidiana e a divergência de Kullback-Leibler são dois exemplos bem conhecidos.

O método NM é consistente com a definição baseada no índice ordinal de Liu-Lu [3] que é a versão modificada do índice de Coleman definido pela Eq. (15) em Coleman (1958). [4] De acordo com esta definição, a matriz   é a "mais próxima" da matriz  , se seus valores dados pelo indice de Liu-Lu forem os mesmos. Por outras palavras, se os valores da matriz   forem ordenados da mesma forma pelo índice Liu-Lu ordinal.

Se a matriz   é uma matriz 2-por-2, o índice Liu-Lu, uma valor escalar, é definido como

 , onde   ;   ;   ;   ;   .

Seguindo Coleman (1958), [4] este índice pode ser interpretado como o “observado menos o esperado sobre o máximo menos o mínimo”, onde   é o valor observado com posição   na matriz de origem   ;   é o o valor esperado (inteiro) sob as suposições contrafactuais de que o total da linha correspondente e o total da coluna de   são predeterminados, enquanto o seu interior é aleatório. Também,   é o valor mínimo se a associação entre a variável de linha e a variável de coluna de   for não negativa. Finalmente,   é o valor máximo de   (   ) para o total da linha dada   e coluna total   .

Para uma matriz   de dimensão n-m (  ,   ), o índice Liu-Lu foi generalizado por Naszodi e Mendonça (2021) [1] para um índice com valor de matriz. Uma das pré-condições para a generalização é que a variável de linha e a variável de coluna da matriz   tem que ser ordenada . Equacionando o índice Liu-Lu generalizado da matriz   com o da matriz   é equivalente a dicotomizar a variável de linha ordenada e variável de coluna ordenada, dando origem a   alternativas, explorando a natureza ordenada das variáveis de linha e coluna. De seguida, equaciona-se os índices Liu-Lu originais de valor escalar das matrizes 2-por-2, obtidas com as dicotomizações, ou seja, para qualquer par de   (  , e   ) a restrição   é imposta, onde   é a matriz  

 
com o primeiro bloco de dimensão  , e o segundo bloco de dimensão   . De forma similar,   de dimensão   é uma matriz dada pela transposta de
 
com o primeiro bloco de dimensão  , e o segundo bloco de dimensão   .

Restrições nos totais de linhas e totais de colunas editar

A matriz   deve satisfazer não só a condição   mas também o par de restrições nos totais de linhas e totais de colunas:   e   .

Solução editar

Assumindo que   para todos os pares   (onde  , e   ), a solução para   é única, determinística e dado por uma fórmula fechada . [1]

Para matrizes   e   de dimensão  , a solução é

  .

As outras 3 células da matriz   são exclusivamente determinadas pelos totais de linha e totais de coluna. Portanto, é assim que o método NM funciona para tabelas de origem 2 por 2.

Para matrizes  , e   com dimensão   (  ,   ), a solução é obtida pela dicotomização de sua variável de linha ordenada e variável de coluna ordenada de todas as maneiras significativas possíveis. De seguida, resolve-se   problemas da forma 2-por-2. Cada problema é definido para um par   (   e   ), colocando a restrição  , bem como a restrição sobre os totais da linha da matriz de destino e os totais da coluna da matriz de destino:  , e  , respectivamente. Cada problema deve ser resolvido separadamente pela fórmula para   . O conjunto de soluções determina   entradas da matriz  . Os restantes   elementos são determinados exclusivamente pelos totais da linha e os totais de coluna matriz de destino.


Em seguida, apresenta-se um exemplo de aplicação do método NM quando a matriz   é tal que a segunda <b id="mwpw">pré-condição</b>   não é cumprida para   .

Se   para todos os pares de  , a solução para   também é única, determinística e dada por uma fórmula de forma fechada. No entanto, o conceito correspondente de rank de matriz é ligeiramente diferente daquele discutido acima . Liu e Lu (2006) [3] definem-no como  , onde   ;   é o menor inteiro sendo maior ou igual a   .

Finalmente, nem o método NM, nem   é definido se   tal que  , enquanto para outro par de    .

Um exemplo numérico editar

Considere a seguinte matriz   complementada com os totais de linha e totais de coluna e os alvos, ou seja, os totais de linha e totais de coluna da matriz   :

Z 1 2 3 4 TOTAL ALVO
1 120 70 30 20 240 400
2 50 100 50 35 235 300
3 30 40 75 40 185 150
4 10 20 30 80 140 150
TOTAL 210 230 185 175 800
ALVO 400 300 200 100 1.000

Na primeira etapa do método NM, a matriz   é multiplicada pelas matrizes  , e   para cada par de   (  , e   ). Esta operação produz as seguintes 9 matrizes de tamanho 2 por 2 com seus totais de linha de destino e totais de coluna:

  1 2 TOTAL ALVO
1 120 120 240 400
2 90 470 560 600
TOTAL 210 590 800
ALVO 400 600 1,000
  1 2 TOTAL ALVO
1 190 50 240 400
2 250 30 560 600
TOTAL 440 360 800
ALVO 700 300 1,000
  1 2 TOTAL ALVO
1 220 20 240 400
2 405 155 560 600
TOTAL 625 175 800
ALVO 900 100 1,000
  1 2 TOTAL ALVO
1 170 305 475 700
2 40 285 325 300
TOTAL 210 590 800
ALVO 400 600 1,000
  1 2 TOTAL ALVO
1 340 135 475 700
2 100 225 325 300
TOTAL 440 360 800
ALVO 700 300 1,000
  1 2 TOTAL ALVO
1 420 55 475 700
2 205 120 325 300
TOTAL 625 175 800
ALVO 900 100 1,000
  1 2 TOTAL ALVO
1 200 460 660 850
2 10 130 140 150
TOTAL 210 590 800
ALVO 400 600 1,000
  1 2 TOTAL ALVO
1 410 250 660 850
2 30 110 140 150
TOTAL 440 360 800
ALVO 700 300 1,000
  1 2 TOTAL ALVO
1 565 95 660 850
2 60 80 140 150
TOTAL 625 175 800
ALVO 900 100 1,000

O próximo passo consiste em calcular o índice Liu-Lu generalizado com valor de matriz  , (onde   ) aplicando a fórmula do índice Liu-Lu de valor escalar original a cada uma das 9 matrizes:

       
  0,39 0,54 0,62
  0,53 0,44 0,47
  0,73 0,61 0,45

Aparentemente, a matriz   é positiva. Portanto, o método NM é definido. A resolução de cada um dos 9 problemas da forma 2 por 2 resulta em 9 entradas da   matriz. As suas outras 7 entradas são determinadas exclusivamente pelos totais da linha de destino e totais da coluna. A solução para   é:

  1 2 3 4 TOTAL
1 253.1 91,4 40,5 15.1 400
2 91.1 147.1 39,8 21.9 300
3 39,6 36,8 64.2 9.3 150
4 16.2 24,7 55,5 53,6 150
TOTAL 400 300 200 100 1.000


Outro exemplo numérico retirado de Abbott et al. (2019) editar

Considere a seguinte matriz   complementado com seus totais de linhas e totais de colunas e os alvos, ou seja, os totais de linha e totais de coluna da matriz   :

Z 1 2 3 TOTAL ALVO
1 1,070 270 20 1.360 1,600
2 300 4,980 560 5.840 5,900
3 20 420 2,360 2.800 2,500
TOTAL 1.390 5.670 2.940 10.000
ALVO 1,390 5,670 2,940 10.000

Como uma primeira etapa do método NM, a matriz   é multiplicada pelas matrizes  , e   para cada par   (  , e   ). Esta operação resulta nas seguintes 4 matrizes de dimensão 2 por 2 com seus totais de linha de destino e totais de coluna:

  1 2 TOTAL ALVO
1 1.070 290 1.360 1.600
2 320 8.320 8.640 8.400
TOTAL 1.390 8.610 10.000
ALVO 1.390 8.610 10.000
  1 2 TOTAL ALVO
1 1.340 20 1.360 1.600
2 5.720 2.920 8.640 8.400
TOTAL 7.060 2.940 10.000
ALVO 7.060 2.940 10.000
  1 2 TOTAL ALVO
1 1.370 5.830 7.200 7.500
2 20 2.780 2.800 2.500
TOTAL 1.390 8.610 10.000
ALVO 1.390 8.610 10.000
  1 2 TOTAL ALVO
1 6.620 580 7.200 7.500
2 440 2.360 2.800 2.500
TOTAL 7.060 2.940 10.000
ALVO 7.060 2.940 10.000

O próximo passo consiste em calcular o índice Liu-Lu com valor de matriz generalizada  , (onde   ), aplicando para tal a fórmula do índice Liu-Lu de valor escalar original a cada uma das 4 matrizes:

     
  0,75 0,95
  0,95 0,78

Aparentemente, a matriz   é positiva. Portanto, o método NM é definido. Resolver cada um dos 4 problemas da forma 2 por 2 produz 4 entradas da   matriz. As restantes 5 entradas são determinadas exclusivamente pelos totais da linha de destino e totais da coluna. A solução para   é:

  1 2 3 TOTAL
1 1.101 476 24 1.600
2 271 4.819 809 5.900
3 18 375 2.107 2.500
TOTAL 1.390 5.670 2.940 10.000

Implementação editar

O método NM é implementado em Excel, [5] Visual Basic, [5] R, [5] e também em Stata . [6]

Aplicações editar

O método NM pode ser aplicado para estudar vários fenômenos, incluindo assortative mating, mobilidade intergeracional como um tipo de mobilidade social, segregação, recrutamento e gestão de talentos .

Em todas as aplicações, as matrizes  ,  , e   representam distribuições conjuntas de entidades combinadas um-para-um (por exemplo, maridos e esposas, ou primogênitos e mães, ou residências e inquilinos principais, ou CEOs e empresas, ou instrutores de xadrez e seus alunos mais talentosos) caracterizados por uma variável categórica dicotômica (por exemplo, assumindo valores vegetarianos/não vegetarianos, Mestre/ou não) ou uma variável categórica multinomial ordenada (por exemplo, nível de escolaridade final, nível de habilidade dos esquiadores, intervalo de renda, categoria de taxa de aluguer, classificação de crédito, títulos FIDE) . Embora o método NM tenha uma ampla aplicabilidade, todos os exemplos a serem apresentados a seguir são sobre assortative mating ao longo do nível de escolaridade. Nessas aplicações, as duas pré-condições (da variável de característica ordenada e assortative mating positivo em todos os grupos educacionais) não são alvo de analise, assumindo que se verificam.

Suponha-se que a matriz   caracteriza a distribuição educacional conjunta de maridos e esposas no Zimbábue, enquanto que a matriz   caracteriza o mesmo no Iêmen. A matriz  , construída com o método NM diz-nos qual seria a distribuição educacional conjunta de casais no Zimbábue, se as distribuições educacionais de maridos e esposas fossem as mesmas do Iêmen, enquanto o desejo geral de homogamia (também chamado de preferências conjugais agregadas em economia, ou harmonização conjugal de normas sociais /barreiras sociais em sociologia) permaneceram inalterados.

Numa segunda aplicação, as matrizes   e   caracterizam o mesmo país em dois periodos diferentes. A matriz   é a distribuição educacional conjunta de recém-casados americanos em 2040, onde os maridos são da Geração Z e sendo jovens adultos quando observados. A matriz   é o mesmo, mas para a Geração Y observada no ano de 2024. Ao construir a matriz  , pode-se estudar no futuro qual seria a distribuição educacional entre os jovens casais americanos recém-casados se eles se ordenassem da mesma forma que os homens da Geração Z e as suas parceiras, enquanto o nível de educação fosse o mesmo entre os homens na Geração Y e suas parceiras.

Numa terceira aplicação, as matrizes   e   caracterizam novamente o mesmo país em dois peridos diferentes. Nesta aplicação, a matriz   é a distribuição educativa conjunta dos jovens casais portugueses (em que a idade dos parceiros masculinos se situa entre os 30 e os 34 anos) em 2011. A matriz   representa o mesmo, mas é observada no ano de 1981. O objetivo seria construir uma matriz   a fim de estudar qual teria sido a distribuição educacional dos jovens casais portugueses se eles tivessem casado como seus pares em 2011, enquanto suas distribuições educacionais específicas por gênero fossem as mesmas de 1981.

Nas duas primeiras aplicações, a matriz   representa uma distribuição conjunta contrafactual. Esta pode ser usada para quantificar alguns efeitos ceteris paribus . Mais precisamente, quantificar em escala cardinal a diferença entre o grau diretamente não observável de seleção conjugal no Zimbábue e no Iêmen, ou na Geração Z e na Geração Y com uma decomposição contrafactual. Para a decomposição, a tabela contrafactual   é usada para calcular a contribuição de cada uma das forças (ou seja, a disponibilidade estrutural observada de parceiros potenciais com vários níveis de educação, determinando as oportunidades no nível da população; e os efeitos não estruturais não observáveis, por exemplo, preferências de correspondência agregada, desejos, normas, barreiras) e a sua interação (ou seja, o efeito de mudanças em preferências/desejos/normas/barreiras agregadas devido a mudanças na disponibilidade estrutural) para uma estatística observável em escala cardinal (por exemplo, a parcela de casais homogâmicos educacionalmente ).

A terceira aplicação foi utilizada por Naszodi e Mendonça (2021) [1] como exemplo para uma contrafactual inviável : o nível de ensino mudou tão drasticamente em Portugal ao longo das três décadas estudadas que este contrafactual seria impossível de obter.

Algumas características do método NM editar

Primeiro, o método NM não produz uma solução significativa se atingir o limite de sua aplicabilidade. [1] Por exemplo, na terceira aplicação, o método NM sinaliza com uma entrada negativa na matriz   que o contrafactual é impossível (ver: AlternativeMethod_US_1980s_2010s_age3035_main.xls Sheet PT_A1981_P2011_Not_meaningful). [5] A este respeito, o método NM é semelhante ao modelo de probabilidade linear que sinaliza o mesmo com uma probabilidade prevista fora do intervalo de unidade   .


Em segundo lugar, o método NM comuta com a agregação de categorias vizinhas da variável de linha e da variável de coluna: [1]  , onde   é a matriz de agregação de linhas de dimensão   ; e  , onde   é a matriz de agregação de colunas de dimensão   .


Em terceiro lugar, o método NM funciona mesmo se houver entradas iguais a zero na matriz   . [1]


Comparação com o método IPF editar

O método de ajuste proporcional iterativo (IPF) também é uma função: [7] [8] [9] [10]   . Este método consiste em encontrar uma matriz ajustada   (   ) que preenche um conjunto de condições semelhantes às da matriz   construída com o método NM. Por exemplo, a matriz   é o mais próxima da matriz   mas com os totais de linha e coluna da matriz de destino   .

No entanto, existem algumas diferenças entre o método IPF e o método NM. O IPF define a proximidade de matrizes com dimensão identica pela entropia cruzada, ou pela divergência de Kullback-Leibler . [11] Assim, o conceito de distância compatível com o IPF entre as matrizes 2-por-2   e   é zero, se os produtos cruzados [10] (também conhecidos por odds ratio) forem os mesmos em ambas as matrizes:   . [12] A condição do método NM para igual ordenação de matrizes   e   é dada por:  .

O exemplo numérico seguinte destaca que o método IPF e o método NM não são idênticos:   . Considere a matriz   com seus alvos :

1 2 TOTAL ALVO
1 450 150 600 1,050
2 50 350 400 450
TOTAL 500 500
ALVO 1,000 500 1.500

O método NM produz a seguinte matriz   :

  1 2 TOTAL
1 925 125 1.050
2 75 375 450
TOTAL 1.000 500 1.500

Enquanto que a solução para a matriz   obtida com o IPF é:

  1 2 TOTAL
1 900 150 1.050
2 100 350 450
TOTAL 1.000 500 1.500

O IPF é equivalente ao estimador de máxima verossimilhança [9] de uma distribuição populacional conjunta, onde a matriz   (a estimativa para a distribuição conjunta da população) é calculada a partir da matriz  , a distribuição conjunta observada em uma amostra aleatória retirada da população caracterizada pelos totais de linhas e totais de colunas da matriz   . Em contraste com o problema resolvido pelo IPF, a matriz   não é amostrada dessa população no problema para o qual o método NM foi desenvolvido. De fato, no problema NM, as matrizes   e   caracterizam duas populações diferentes (observadas simultaneamente como na aplicação para o Zimbábue e o Iêmen, ou observadas em dois periodos temporais diferentes como na aplicação para as populações da Geração Z e Geração Y ). Esta diferença facilita a escolha entre o método NM e o IPF em aplicações empíricas. [12]


</br>Deming e Stephan (1940), [13] os inventores do IPF, ilustraram a aplicação de seu método num problema clássico de estimação por máxima verossimilhança, onde a matriz   foi amostrada da população caracterizada pelos totais de linhas e totais de colunas da matriz  . Eles estavam cientes do fato de que, em geral, o IPF não é adequado para previsões contrafactuais, e alertaram explicitamente que seu algoritmo “não é útil por si só para previsões” (ver Stephan e Deming 1940 p. 444). [13] [12]

Além disso, o método IPF e o método NM produzem soluções para dominios diferentes. Primeiro, ao contrário do método NM, o IPF não fornece uma solução para todas as tabelas de origem   com entradas iguais a zero (Csiszár (1975) [14] encontrou condições necessárias e suficientes para a aplicação do IPF com tabelas gerais com entradas iguais a zero). Em segundo lugar, ao contrário do IPF, o método NM não fornece uma solução significativa para pares de matrizes   e   que definem contrafactuais impossíveis. Em terceiro lugar, a pré-condição do método NM (seja   ou   ) não é condição de aplicabilidade do IPF.

Finalmente, ao contrário do NM, o IPF não comuta com a operação de fusão das categorias vizinhas da variável linha e da variável coluna conforme ilustrado com um exemplo numérico em Naszodi(2023) (ver página 10). [15] Por esta razão, a tabela transformada obtida com o IPF pode ser sensível à escolha do número de categorias de características.

Comparação com a Abordagem da Distância Euclidiana Mínima editar

A abordagem de distância euclidiana mínima ( MEDA ) (definida por Abbott et al., 2019 seguindo Fernández e Rogerson, 2001) também é uma função: [16] [17]   .

Primeiro, a MEDA atribui um escalar à matriz   : é o peso usado para construir a combinação convexa de dois casos extremos (casamento aleatório e perfeitamente seletivo com o par de marginais  ) minimizando a distância Eucledeana com   . Por exemplo, este escalar é   no exemplo numérico retirado de Abbott et al.(2019) . [16] Em segundo lugar, para qualquer par de distribuições marginais contrafactuais (   ) o MEDA constrói a combinação convexa dos dois casos extremos (correspondências aleatórias e perfeitamente seletivas com o par de marginais (   )).


Diferenças entre o NM e o MEDA: enquanto o NM mantém a seletividade inalterada, mantendo o índice Liu-Lu com valor de matriz generalizada   fixo, o MEDA faz o mesmo mantendo o escalar   fixo. Para  , e   duas matrizes de dimensão   os dois métodos produzem a mesma tabela transformada caso   ordene as tabelas de contingência da mesma forma que o índice Liu-Lu. [18] No entanto, para matrizes   com dimensões superiores a 2-por-2, o índice Liu-Lu generalizado tem valor de matriz, e portanto é diferente do valor de escalar   . Portanto, a tabela transformada com o método NM também é diferente da tabela transformada com o método MEDA.

Por exemplo, no exemplo numérico retirado de Abbott et al.(2019), a tabela contrafactual construída pelo MEDA é a matriz   :

  1 2 3 TOTAL
1 1.081 240 279 1.600
2 217 5.054 629 5.900
3 92 376 2.032 2.500
TOTAL 1.390 5.670 2.940 10.000

A diferença entre a matriz   e matriz   não é desprezível. Por exemplo, a parcela de casais homogamicos é 2 pontos percentuais menor na matriz contrafactual   construída pelo MEDA do que na matriz observada  , enquanto é 3,4 pontos percentuais menor na matriz contrafactual construída pelo NM   relativo a   .

Como o exemplo de Abbott não é fictício, mas sim baseado na distribuição educacional empírica de casais americanos, a diferença entre 2 pontos percentuais e 3,4 pontos percentuais pode ser interpretada como: o MEDA quantifica mudanças na desigualdade de uma geração para outra geração a que são significativamente menores em comparação com o NM.


Referências

  1. a b c d e f g Naszodi, A.; Mendonca, F. (2021). «A new method for identifying the role of marital preferences at shaping marriage patterns». Journal of Demographic Economics. 1 (1): 1–27. doi:10.1017/dem.2021.1  
  2. Naszodi, A.; Mendonca, F. (2019). «Like marries like». Fairness Policy Brief Series. Cópia arquivada em 2019 
  3. a b Liu, H.; Lu, J. (2006). «Measuring the degree of assortative mating». Economics Letters. 92 (3): 317–322. doi:10.1016/j.econlet.2006.03.010  
  4. a b Coleman, J. (1958). «Relational Analysis: The Study of Social Organizations with Survey Methods». Human Organization. 17 (4): 28–36. doi:10.17730/humo.17.4.q5604m676260q8n7 
  5. a b c d Naszodi, Anna; Mendonca, Francisco (2021). «Code for A NEW METHOD». Mendeley. 2. doi:10.17632/x2ry7bcm95.2 
  6. Naszodi, Anna; Mendonca, Francisco (2023). «Code for "A NEW METHOD FOR IDENTIFYING WHAT CUPID'S INVISIBLE HAND IS DOING. IS IT SPREADING COLOR BLINDNESS WHILE TURNING US MORE "PICKY" ABOUT SPOUSAL EDUCATION?"». Mendeley. doi:10.17632/95k6mmrxvg 
  7. Sinkhorn, Richard (1964). “A Relationship Between Arbitrary Positive Matrices and Doubly Stochastic Matrices”. In: Annals of Mathematical Statistics 35.2, pp. 876–879.
  8. Bacharach, Michael (1965). “Estimating Nonnegative Matrices from Marginal Data”. In: International Economic Review 6.3, pp. 294–310.
  9. a b Bishop, Y. M. M. (1967). «Multidimensional contingency tables: cell estimates». PhD Thesis. Harvard University 
  10. a b Fienberg, S. E. (1970). «An Iterative Procedure for Estimation in Contingency Tables». Annals of Mathematical Statistics. 41 (3): 907–917. JSTOR 2239244. MR 266394. Zbl 0198.23401. doi:10.1214/aoms/1177696968  
  11. Kullback S. and Leibler R.A. (1951) On information and sufficiency, Annals of Mathematics and Statistics, 22 (1951) 79-86.
  12. a b c Naszodi, A. «The iterative proportional fitting algorithm and the NM-method: solutions for two different sets of problems». arXiv:2303.05515  [econ.GN] 
  13. a b Deming, W. E.; Stephan, F. F. (1940). «On a Least Squares Adjustment of a Sampled Frequency Table When the Expected Marginal Totals are Known». Annals of Mathematical Statistics. 11 (4): 427–444. MR 3527. doi:10.1214/aoms/1177731829  
  14. Csiszár, I. (1975). «I-Divergence of Probability Distributions and Minimization Problems». Annals of Probability. 3 (1): 146–158. JSTOR 2959270. MR 365798. Zbl 0318.60013. doi:10.1214/aop/1176996454  
  15. Naszodi, A. «What do surveys say about the historical trend of inequality and the applicability of two table-transformation methods?». arXiv:2303.05895  [econ.GN] 
  16. a b Abbott, B.; Gallipoli, G.; Meghir, C.; Violante, G.L. (2019). «Education policy and intergenerational transfers in equilibrium». Journal of Political Economy. 127 (6): 2569–2624. doi:10.1086/702241 
  17. Fernández, R.; Rogerson, R. (2001). «Sorting and long-run inequality» (PDF). The Quarterly Journal of Economics. 116 (4): 1305–1341. doi:10.1162/003355301753265589 
  18. Chiappori, P-A.; Costa-Dias, M.; Meghir, C. (2021). «The measuring of assortativeness in marriage: A comment». Cowles Foundation Discussion Paper NO. 2316