FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4578, 774 aa 1>>>pF1KE4578 774 - 774 aa - 774 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.9004+/-0.000967; mu= 17.2977+/- 0.058 mean_var=78.5109+/-15.879, 0's: 0 Z-trim(105.7): 36 B-trim: 63 in 1/49 Lambda= 0.144747 statistics sampled from 8527 (8558) to 8527 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.617), E-opt: 0.2 (0.263), width: 16 Scan time: 3.270 The best scores are: opt bits E(32554) CCDS34864.1 LOXL2 gene_id:4017|Hs108|chr8 ( 774) 5505 1159.7 0 CCDS1953.1 LOXL3 gene_id:84695|Hs108|chr2 ( 753) 3125 662.7 6e-190 CCDS7473.1 LOXL4 gene_id:84171|Hs108|chr10 ( 756) 2299 490.2 5.1e-138 CCDS74527.1 LOXL3 gene_id:84695|Hs108|chr2 ( 608) 2177 464.7 2e-130 CCDS4129.1 LOX gene_id:4015|Hs108|chr5 ( 417) 759 168.5 2e-41 CCDS10253.1 LOXL1 gene_id:4016|Hs108|chr15 ( 574) 737 164.0 6.2e-40 CCDS44490.1 DMBT1 gene_id:1755|Hs108|chr10 (2413) 546 124.4 2.2e-27 CCDS1171.1 CD5L gene_id:922|Hs108|chr1 ( 347) 430 99.8 8.1e-21 CCDS53742.1 CD163 gene_id:9332|Hs108|chr12 (1121) 419 97.7 1.1e-19 CCDS8578.1 CD163 gene_id:9332|Hs108|chr12 (1156) 419 97.7 1.1e-19 CCDS8577.1 CD163L1 gene_id:283316|Hs108|chr12 (1453) 406 95.1 8.9e-19 CCDS73434.1 CD163L1 gene_id:283316|Hs108|chr12 (1463) 406 95.1 8.9e-19 CCDS44492.1 DMBT1 gene_id:1755|Hs108|chr10 (2403) 381 89.9 5.1e-17 CCDS58137.1 CD6 gene_id:923|Hs108|chr11 ( 592) 372 87.8 5.6e-17 CCDS58138.1 CD6 gene_id:923|Hs108|chr11 ( 601) 372 87.8 5.7e-17 CCDS7999.1 CD6 gene_id:923|Hs108|chr11 ( 668) 372 87.8 6.3e-17 CCDS59424.1 SSC5D gene_id:284297|Hs108|chr19 ( 951) 367 86.8 1.7e-16 CCDS11759.1 LGALS3BP gene_id:3959|Hs108|chr17 ( 585) 364 86.1 1.8e-16 CCDS46196.1 SSC5D gene_id:284297|Hs108|chr19 (1573) 367 86.9 2.7e-16 CCDS5995.1 MSR1 gene_id:4481|Hs108|chr8 ( 451) 359 85.0 2.9e-16 CCDS5585.1 SSC4D gene_id:136853|Hs108|chr7 ( 575) 360 85.3 3.1e-16 CCDS2124.1 MARCO gene_id:8685|Hs108|chr2 ( 520) 356 84.4 5.1e-16 CCDS3709.1 PRSS12 gene_id:8492|Hs108|chr4 ( 875) 351 83.5 1.6e-15 CCDS44491.1 DMBT1 gene_id:1755|Hs108|chr10 (1785) 355 84.5 1.7e-15 CCDS6064.1 SCARA5 gene_id:286133|Hs108|chr8 ( 495) 340 81.1 5e-15 CCDS45162.1 HHIPL1 gene_id:84439|Hs108|chr14 ( 782) 338 80.7 9.8e-15 >>CCDS34864.1 LOXL2 gene_id:4017|Hs108|chr8 (774 aa) initn: 5505 init1: 5505 opt: 5505 Z-score: 6209.5 bits: 1159.7 E(32554): 0 Smith-Waterman score: 5505; 99.9% identity (100.0% similar) in 774 aa overlap (1-774:1-774) 10 20 30 40 50 60 pF1KE4 MERPLCSHLCSCLAMLALLSPLSLAQYDSWPHYPEYFQQPAPEYHQPQAPANVAKIQLRL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 MERPLCSHLCSCLAMLALLSPLSLAQYDSWPHYPEYFQQPAPEYHQPQAPANVAKIQLRL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 AGQKRKHSEGRVEVYYDGQWGTVCDDDFSIHAAHVVCRELGYVEAKSWTASSSYGKGEGP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 AGQKRKHSEGRVEVYYDGQWGTVCDDDFSIHAAHVVCRELGYVEAKSWTASSSYGKGEGP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 IWLDNLHCTGNEATLAACTSNGWGVTDCKHTEDVGVVCSDKRIPGFKFDNSLINQIENLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 IWLDNLHCTGNEATLAACTSNGWGVTDCKHTEDVGVVCSDKRIPGFKFDNSLINQIENLN 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 IQVEDIRIRAILSTYRKRTPVMEGYVEVKEGKTWKQICDKHWTAKNSRVVCGMFGFPGER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 IQVEDIRIRAILSTYRKRTPVMEGYVEVKEGKTWKQICDKHWTAKNSRVVCGMFGFPGER 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 TYNTKVYKMFASRRKQRYWPFSMDCTGTEAHISSCKLGPQVSLDPMKNVTCENGLPAVVS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 TYNTKVYKMFASRRKQRYWPFSMDCTGTEAHISSCKLGPQVSLDPMKNVTCENGLPAVVS 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 CVPGQVFSPDGPSRFRKAYKPEQPLVRLRGGAYIGEGRVEVLKNGEWGTVCDDKWDLVSA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 CVPGQVFSPDGPSRFRKAYKPEQPLVRLRGGAYIGEGRVEVLKNGEWGTVCDDKWDLVSA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 SVVCRELGFGSAKEAVTGSRLGQGIGPIHLNEIQCTGNEKSIIDCKFNAESQGCNHEEDA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 SVVCRELGFGSAKEAVTGSRLGQGIGPIHLNEIQCTGNEKSIIDCKFNAESQGCNHEEDA 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 GVRCNTPAMGLQKKLRLNGGRNPYEGRVEVLVERNGSLVWGMVCGQNWGIVEAMVVCRQL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 GVRCNTPAMGLQKKLRLNGGRNPYEGRVEVLVERNGSLVWGMVCGQNWGIVEAMVVCRQL 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE4 GLGFASNAFQETWYWHGDVNSNKVVMSGVKCSGTELSLAHCRHDGEDVACPQGGVQYGAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 GLGFASNAFQETWYWHGDVNSNKVVMSGVKCSGTELSLAHCRHDGEDVACPQGGVQYGAG 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE4 VACSETAPDLVLNAEMVQQTTYLEDRPMFLLQCAMEENCLSASAAQTDPTTGYRRLLRFS :::::::::::::::::::::::::::::.:::::::::::::::::::::::::::::: CCDS34 VACSETAPDLVLNAEMVQQTTYLEDRPMFMLQCAMEENCLSASAAQTDPTTGYRRLLRFS 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE4 SQIHNNGQSDFRPKNGRHAWIWHDCHRHYHSMEVFTHYDLLNLNGTKVAEGHKASFCLED :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 SQIHNNGQSDFRPKNGRHAWIWHDCHRHYHSMEVFTHYDLLNLNGTKVAEGHKASFCLED 610 620 630 640 650 660 670 680 690 700 710 720 pF1KE4 TECEGDIQKNYECANFGDQGITMGCWDMYRHDIDCQWVDITDVPPGDYLFQVVINPNFEV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 TECEGDIQKNYECANFGDQGITMGCWDMYRHDIDCQWVDITDVPPGDYLFQVVINPNFEV 670 680 690 700 710 720 730 740 750 760 770 pF1KE4 AESDYSNNIMKCRSRYDGHRIWMYNCHIGGSFSEETEKKFEHFSGLLNNQLSPQ :::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 AESDYSNNIMKCRSRYDGHRIWMYNCHIGGSFSEETEKKFEHFSGLLNNQLSPQ 730 740 750 760 770 >>CCDS1953.1 LOXL3 gene_id:84695|Hs108|chr2 (753 aa) initn: 2887 init1: 1665 opt: 3125 Z-score: 3523.6 bits: 662.7 E(32554): 6e-190 Smith-Waterman score: 3125; 55.1% identity (79.6% similar) in 760 aa overlap (19-771:1-752) 10 20 30 40 50 pF1KE4 MERPLCSHLCSCLAMLALLSPLSLAQYDSWPHY-----PEYFQQPAPEYHQPQAPANVAK . :.:. :.. : . .:.: :. :. CCDS19 MRPVSVWQWSPWGLLLCLLCSSCLGSPSPSTG-PEKKAGSQG 10 20 30 40 60 70 80 90 100 110 pF1KE4 IQLRLAGQKRKHSEGRVEVYYDGQWGTVCDDDFSIHAAHVVCRELGYVEAKSWTASSSYG ...:::: :: :::::. :.:::.:::::...:::..:::::..:: .:: :..:: CCDS19 LRFRLAGFPRKPYEGRVEIQRAGEWGTICDDDFTLQAAHILCRELGFTEATGWTHSAKYG 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE4 KGEGPIWLDNLHCTGNEATLAACTSNGWGVTDCKHTEDVGVVCSDKRIPGFKFDNSLINQ : : :::::: :.:.: ... :.: ::: .:: : ::.::.:.:.:.:::. :...: . CCDS19 PGTGRIWLDNLSCSGTEQSVTECASRGWGNSDCTHDEDAGVICKDQRLPGFS-DSNVI-E 110 120 130 140 150 180 190 200 210 220 230 pF1KE4 IENLNIQVEDIRIRAILSTYRKRTPVMEGYVEVKEGKTWKQICDKHWTAKNSRVVCGMFG .:. ..:::..::: .. :. :: :: :::. :.:.::: :.:.::.:::::.: CCDS19 VEH-HLQVEEVRIRPAVGWGRRPLPVTEGLVEVRLPDGWSQVCDKGWSAHNSHVVCGMLG 160 170 180 190 200 210 240 250 260 270 280 290 pF1KE4 FPGERTYNTKVYKMFASRRKQRYWPFSMDCTGTEAHISSCKLGPQVSLDPMKNVTCENGL ::.:. :. :...:.:... . .. :.:::::.: :.: . : . : .: CCDS19 FPSEKRVNAAFYRLLAQRQQHSFGLHGVACVGTEAHLSLCSLEFYRANDTAR---CPGGG 220 230 240 250 260 270 300 310 320 330 340 350 pF1KE4 PAVVSCVPGQVFSPDGPSRFRKAYKPE-QPLVRLRGGAYIGEGRVEVLKNGEWGTVCDDK ::::::::: :.. .. .. .. ::. . :::.:::. ::::::::: . :::::: : CCDS19 PAVVSCVPGPVYAASSGQKKQQQSKPQGEARVRLKGGAHPGEGRVEVLKASTWGTVCDRK 280 290 300 310 320 330 360 370 380 390 400 410 pF1KE4 WDLVSASVVCRELGFGSAKEAVTGSRLGQGIGPIHLNEIQCTGNEKSIIDCKF-NAESQG ::: .:::::::::::::.::..:.:.:::.: :::.:..:.:.: :. : : .. CCDS19 WDLHAASVVCRELGFGSAREALSGARMGQGMGAIHLSEVRCSGQELSLWKCPHKNITAED 340 350 360 370 380 390 420 430 440 450 460 470 pF1KE4 CNHEEDAGVRCNTPAMGLQKKLRLNGGRNPYEGRVEVLVERNGSLVWGMVCGQNWGIVEA :.: .::::::: : : . ..::.:::. .:::::: . : : ::..::..:: .:: CCDS19 CSHSQDAGVRCNLPYTGAETRIRLSGGRSQHEGRVEVQIGGPGPLRWGLICGDDWGTLEA 400 410 420 430 440 450 480 490 500 510 520 530 pF1KE4 MVVCRQLGLGFASNAFQETWYWHGDVNSNKVVMSGVKCSGTELSLAHCRHDGEDVACPQG ::.:::::::.:....:::::: . : ..::::::.:.:::::: .: : : ..: . CCDS19 MVACRQLGLGYANHGLQETWYWDSG-NITEVVMSGVRCTGTELSLDQCAHHGTHITCKRT 460 470 480 490 500 510 540 550 560 570 580 590 pF1KE4 GVQYGAGVACSETAPDLVLNAEMVQQTTYLEDRPMFLLQCAMEENCLSASAAQTDPTTGY :... ::: ::::: ::.:.. .::.:.:.::::. .: :: :::::..:: ... :. CCDS19 GTRFTAGVICSETASDLLLHSALVQETAYIEDRPLHMLYCAAEENCLASSARSANWPYGH 520 530 540 550 560 570 600 610 620 630 640 650 pF1KE4 RRLLRFSSQIHNNGQSDFRPKNGRHAWIWHDCHRHYHSMEVFTHYDLLNLNGTKVAEGHK :::::::::::: :..::::: :::.:.::.:: :::::..:::::.:. :::::::::: CCDS19 RRLLRFSSQIHNLGRADFRPKAGRHSWVWHECHGHYHSMDIFTHYDILTPNGTKVAEGHK 580 590 600 610 620 630 660 670 680 690 700 710 pF1KE4 ASFCLEDTECEGDIQKNYECANFGDQGITMGCWDMYRHDIDCQWVDITDVPPGDYLFQVV ::::::::::. :..: :::::::.::::.::::.:::::::::.::::: ::.:..::: CCDS19 ASFCLEDTECQEDVSKRYECANFGEQGITVGCWDLYRHDIDCQWIDITDVKPGNYILQVV 640 650 660 670 680 690 720 730 740 750 760 770 pF1KE4 INPNFEVAESDYSNNIMKCRSRYDGHRIWMYNCHIGGSFSEETEKKFEHFSGLLNNQLSP :::::::::::..:: ::: .:::::::..::::: .::::....::.. : .::. CCDS19 INPNFEVAESDFTNNAMKCNCKYDGHRIWVHNCHIGDAFSEEANRRFERYPGQTSNQII 700 710 720 730 740 750 pF1KE4 Q >>CCDS7473.1 LOXL4 gene_id:84171|Hs108|chr10 (756 aa) initn: 2334 init1: 1594 opt: 2299 Z-score: 2591.4 bits: 490.2 E(32554): 5.1e-138 Smith-Waterman score: 3014; 55.3% identity (78.8% similar) in 740 aa overlap (47-769:21-754) 20 30 40 50 60 70 pF1KE4 ALLSPLSLAQYDSWPHYPEYFQQPAPEYHQPQAPANVAKIQLRLAGQKRKHSEGRVEVYY :. : ... .:::.: . : :::.:: . CCDS74 MAWSPPATLFLFLLLLGQPPPSRPQSLGTTKLRLVGPESKPEEGRLEVLH 10 20 30 40 50 80 90 100 110 120 130 pF1KE4 DGQWGTVCDDDFSIHAAHVVCRELGYVEAKSWTASSSYGKGEGPIWLDNLHCTGNEATLA .:::::::::.:.:. : :.::.::. : .:. :..::.:::::::::..:.:.:..: CCDS74 QGQWGTVCDDNFAIQEATVACRQLGFEAALTWAHSAKYGQGEGPIWLDNVRCVGTESSLD 60 70 80 90 100 110 140 150 160 170 180 190 pF1KE4 ACTSNGWGVTDCKHTEDVGVVCSDKRIPGFKFDNSLINQIENLNIQVEDIRIRAILSTYR : ::::::.::.:.:::::.: .: :. ..... : . . ..:..:.. ::.. . CCDS74 QCGSNGWGVSDCSHSEDVGVICHPRRHRGY-LSETVSNALGPQGRRLEEVRLKPILASAK 120 130 140 150 160 200 210 220 230 240 250 pF1KE4 KRTPVMEGYVEVKEGKTWKQICDKHWTAKNSRVVCGMFGFPGERTYNTKVYKMF------ ...:: :: :::: :.:.::. :: .::::::::.:::.: ... :. CCDS74 QHSPVTEGAVEVKYEGHWRQVCDQGWTMNNSRVVCGMLGFPSEVPVDSHYYRKVWDLKMR 170 180 190 200 210 220 260 270 280 290 300 pF1KE4 --ASR-----RKQRYWPFSMDCTGTEAHISSCKLGPQVSLDPMKNV---TCENGLPAVVS :: :. .: .. : ::: :...: ::.. : .. .: .:. :::: CCDS74 DPKSRLKSLTNKNSFWIHQVTCLGTEPHMANC----QVQVAPARGKLRPACPGGMHAVVS 230 240 250 260 270 280 310 320 330 340 350 360 pF1KE4 CVPGQVFSPDGPSRFRKAYKPEQPLVRLRGGAYIGEGRVEVLKNGEWGTVCDDKWDLVSA :: : : : . ::. :.: ::::.:: .:::::::: : .:::::: .:.:.:: CCDS74 CVAGPHFRPPKTKPQRKGSWAEEPRVRLRSGAQVGEGRVEVLMNRQWGTVCDHRWNLISA 290 300 310 320 330 340 370 380 390 400 410 pF1KE4 SVVCRELGFGSAKEAVTGSRLGQGIGPIHLNEIQCTGNEKSIIDCKFNAESQ-GCNHEED :::::.::::::.::. :.:::::.:::::.:..: : :... :: :: ::.::.: CCDS74 SVVCRQLGFGSAREALFGARLGQGLGPIHLSEVRCRGYERTLSDCPALEGSQNGCQHEND 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE4 AGVRCNTPAMGLQKKLRLNGGRNPYEGRVEVLVERNGSLVWGMVCGQNWGIVEAMVVCRQ :.::::.: ::.:...:: ::: : :: .:: :: :: :: ::..:::..::::.::: CCDS74 AAVRCNVPNMGFQNQVRLAGGRIPEEGLLEVQVEVNGVPRWGSVCSENWGLTEAMVACRQ 410 420 430 440 450 460 480 490 500 510 520 530 pF1KE4 LGLGFASNAFQETWYWHGDVNSNKVVMSGVKCSGTELSLAHCRHDGEDVACPQGGVQYGA :::::: .:..:::.: : ...::::::.::::::.: .:.. : : : .:: .. : CCDS74 LGLGFAIHAYKETWFWSGTPRAQEVVMSGVRCSGTELALQQCQRHGP-VHCSHGGGRFLA 470 480 490 500 510 520 540 550 560 570 580 590 pF1KE4 GVACSETAPDLVLNAEMVQQTTYLEDRPMFLLQCAMEENCLSASAAQTDPTTGYRRLLRF ::.: ..:::::.::..::.:.::::::. : :: :::::: :: . : :::::::: CCDS74 GVSCMDSAPDLVMNAQLVQETAYLEDRPLSQLYCAHEENCLSKSADHMDWPYGYRRLLRF 530 540 550 560 570 580 600 610 620 630 640 650 pF1KE4 SSQIHNNGQSDFRPKNGRHAWIWHDCHRHYHSMEVFTHYDLLNLNGTKVAEGHKASFCLE :.::.: :..:::::.:: .:.::.:::::::.:::::::::.:::.::::::::::::: CCDS74 STQIYNLGRTDFRPKTGRDSWVWHQCHRHYHSIEVFTHYDLLTLNGSKVAEGHKASFCLE 590 600 610 620 630 640 660 670 680 690 700 710 pF1KE4 DTECEGDIQKNYECANFGDQGITMGCWDMYRHDIDCQWVDITDVPPGDYLFQVVINPNFE ::.: .:. : :::::.::.:.:::: ::::::::::::::: ::.:.:::..::..: CCDS74 DTNCPTGLQRRYACANFGEQGVTVGCWDTYRHDIDCQWVDITDVGPGNYIFQVIVNPHYE 650 660 670 680 690 700 720 730 740 750 760 770 pF1KE4 VAESDYSNNIMKCRSRYDGHRIWMYNCHIGGSFSEETEKKFEHFSGLLNNQLSPQ :::::.:::...:: .:::::.:..::: :.:. ..: ..:. . : :: CCDS74 VAESDFSNNMLQCRCKYDGHRVWLHNCHTGNSYPANAELSLEQEQRLRNNLI 710 720 730 740 750 >>CCDS74527.1 LOXL3 gene_id:84695|Hs108|chr2 (608 aa) initn: 2673 init1: 1665 opt: 2177 Z-score: 2455.1 bits: 464.7 E(32554): 2e-130 Smith-Waterman score: 2420; 47.4% identity (66.0% similar) in 759 aa overlap (19-771:1-607) 10 20 30 40 50 pF1KE4 MERPLCSHLCSCLAMLALLSPLSLAQYDSWPHY-----PEYFQQPAPEYHQPQAPANVAK . :.:. :.. : . .:.: :. :. CCDS74 MRPVSVWQWSPWGLLLCLLCSSCLGSPSPSTG-PEKKAGSQG 10 20 30 40 60 70 80 90 100 110 pF1KE4 IQLRLAGQKRKHSEGRVEVYYDGQWGTVCDDDFSIHAAHVVCRELGYVEAKSWTASSSYG ...:::: :: :::::. :.:::.:::::...:::..:::::..:: .:: :..:: CCDS74 LRFRLAGFPRKPYEGRVEIQRAGEWGTICDDDFTLQAAHILCRELGFTEATGWTHSAKYG 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE4 KGEGPIWLDNLHCTGNEATLAACTSNGWGVTDCKHTEDVGVVCSDKRIPGFKFDNSLINQ : : :::::: :.:.: ... :.: ::: .:: : ::.::.:.:.:.:::. :...: CCDS74 PGTGRIWLDNLSCSGTEQSVTECASRGWGNSDCTHDEDAGVICKDQRLPGFS-DSNVI-- 110 120 130 140 150 180 190 200 210 220 230 pF1KE4 IENLNIQVEDIRIRAILSTYRKRTPVMEGYVEVKEGKTWKQICDKHWTAKNSRVVCGMFG CCDS74 ------------------------------------------------------------ 240 250 260 270 280 290 pF1KE4 FPGERTYNTKVYKMFASRRKQRYWPFSMDCTGTEAHISSCKLGPQVSLDPMKNVTCENGL ::. CCDS74 ---------------------------------EAR------------------------ 160 300 310 320 330 340 350 pF1KE4 PAVVSCVPGQVFSPDGPSRFRKAYKPEQPLVRLRGGAYIGEGRVEVLKNGEWGTVCDDKW :::.:::. ::::::::: . :::::: :: CCDS74 ------------------------------VRLKGGAHPGEGRVEVLKASTWGTVCDRKW 170 180 190 360 370 380 390 400 410 pF1KE4 DLVSASVVCRELGFGSAKEAVTGSRLGQGIGPIHLNEIQCTGNEKSIIDCKF-NAESQGC :: .:::::::::::::.::..:.:.:::.: :::.:..:.:.: :. : : .. : CCDS74 DLHAASVVCRELGFGSAREALSGARMGQGMGAIHLSEVRCSGQELSLWKCPHKNITAEDC 200 210 220 230 240 250 420 430 440 450 460 470 pF1KE4 NHEEDAGVRCNTPAMGLQKKLRLNGGRNPYEGRVEVLVERNGSLVWGMVCGQNWGIVEAM .: .::::::: : : . ..::.:::. .:::::: . : : ::..::..:: .::: CCDS74 SHSQDAGVRCNLPYTGAETRIRLSGGRSQHEGRVEVQIGGPGPLRWGLICGDDWGTLEAM 260 270 280 290 300 310 480 490 500 510 520 530 pF1KE4 VVCRQLGLGFASNAFQETWYWHGDVNSNKVVMSGVKCSGTELSLAHCRHDGEDVACPQGG :.:::::::.:....:::::: . : ..::::::.:.:::::: .: : : ..: . : CCDS74 VACRQLGLGYANHGLQETWYWDSG-NITEVVMSGVRCTGTELSLDQCAHHGTHITCKRTG 320 330 340 350 360 370 540 550 560 570 580 590 pF1KE4 VQYGAGVACSETAPDLVLNAEMVQQTTYLEDRPMFLLQCAMEENCLSASAAQTDPTTGYR ... ::: ::::: ::.:.. .::.:.:.::::. .: :: :::::..:: ... :.: CCDS74 TRFTAGVICSETASDLLLHSALVQETAYIEDRPLHMLYCAAEENCLASSARSANWPYGHR 380 390 400 410 420 430 600 610 620 630 640 650 pF1KE4 RLLRFSSQIHNNGQSDFRPKNGRHAWIWHDCHRHYHSMEVFTHYDLLNLNGTKVAEGHKA ::::::::::: :..::::: :::.:.::.:: :::::..:::::.:. ::::::::::: CCDS74 RLLRFSSQIHNLGRADFRPKAGRHSWVWHECHGHYHSMDIFTHYDILTPNGTKVAEGHKA 440 450 460 470 480 490 660 670 680 690 700 710 pF1KE4 SFCLEDTECEGDIQKNYECANFGDQGITMGCWDMYRHDIDCQWVDITDVPPGDYLFQVVI :::::::::. :..: :::::::.::::.::::.:::::::::.::::: ::.:..:::: CCDS74 SFCLEDTECQEDVSKRYECANFGEQGITVGCWDLYRHDIDCQWIDITDVKPGNYILQVVI 500 510 520 530 540 550 720 730 740 750 760 770 pF1KE4 NPNFEVAESDYSNNIMKCRSRYDGHRIWMYNCHIGGSFSEETEKKFEHFSGLLNNQLSPQ ::::::::::..:: ::: .:::::::..::::: .::::....::.. : .::. CCDS74 NPNFEVAESDFTNNAMKCNCKYDGHRIWVHNCHIGDAFSEEANRRFERYPGQTSNQII 560 570 580 590 600 >>CCDS4129.1 LOX gene_id:4015|Hs108|chr5 (417 aa) initn: 705 init1: 492 opt: 759 Z-score: 857.3 bits: 168.5 E(32554): 2e-41 Smith-Waterman score: 759; 47.1% identity (72.4% similar) in 221 aa overlap (531-748:195-414) 510 520 530 540 550 pF1KE4 SNKVVMSGVKCSGTELSLAHCRHDGEDVACPQGGVQYGAGVACSETA-PDLVLNAEMVQQ : : . : :.. . . :::: . ..: CCDS41 GMVGDDPYNPYKYSDDNPYYNYYDTYERPRPGGRYRPGYGTGYFQYGLPDLVADPYYIQA 170 180 190 200 210 220 560 570 580 590 600 610 pF1KE4 TTYLEDRPMFLLQCAMEENCLSASAAQTDPTT-GYRRLLRFSSQIHNNGQSDFRPKNGRH .::.. :. :.:: :::::...: ..: .: :::: ....:.: ::: :. :. CCDS41 STYVQKMSMYNLRCAAEENCLASTAYRADVRDYDHRVLLRFPQRVKNQGTSDFLPSRPRY 230 240 250 260 270 280 620 630 640 650 660 670 pF1KE4 AWIWHDCHRHYHSMEVFTHYDLLNLNGTK-VAEGHKASFCLEDTECEGDIQKNYECANFG .: ::.::.:::::. :.:::::. : . :::::::::::::: :. .. . :. CCDS41 SWEWHSCHQHYHSMDEFSHYDLLDANTQRRVAEGHKASFCLEDTSCDYGYHRRFACTAH- 290 300 310 320 330 340 680 690 700 710 720 730 pF1KE4 DQGITMGCWDMYRHDIDCQWVDITDVPPGDYLFQVVINPNFEVAESDYSNNIMKCRSRYD ::.. ::.: : ::::::.::::: ::.:...: .::.. : ::::.::...: :: CCDS41 TQGLSPGCYDTYGADIDCQWIDITDVKPGNYILKVSVNPSYLVPESDYTNNVVRCDIRYT 350 360 370 380 390 400 740 750 760 770 pF1KE4 GHRIWMYNCHIGGSFSEETEKKFEHFSGLLNNQLSPQ ::. . .: : CCDS41 GHHAYASGCTISPY 410 >>CCDS10253.1 LOXL1 gene_id:4016|Hs108|chr15 (574 aa) initn: 705 init1: 471 opt: 737 Z-score: 830.4 bits: 164.0 E(32554): 6.2e-40 Smith-Waterman score: 737; 46.5% identity (72.2% similar) in 230 aa overlap (525-748:344-571) 500 510 520 530 540 550 pF1KE4 WHGDVNSNKVVMSGVKCSGTELSLAHCRHDGEDVACPQGGVQYGAGVACSETA---PDLV :: . :: .. :. .... :::: CCDS10 ANPPPEAYGPPRALEPPYLPVRSSDTPPPGGERNGAQQGRLSVGSVYRPNQNGRGLPDLV 320 330 340 350 360 370 560 570 580 590 600 pF1KE4 LNAEMVQQTTYLEDRPMFLLQCAMEENCLSASAAQTDPTTGY--RRLLRFSSQIHNNGQS . ..:: .::.. .. :.:: ::.:: ::.: . .: : : :::: ....:.: . CCDS10 PDPNYVQASTYVQRAHLYSLRCAAEEKCL-ASTAYAPEATDYDVRVLLRFPQRVKNQGTA 380 390 400 410 420 430 610 620 630 640 650 660 pF1KE4 DFRPKNGRHAWIWHDCHRHYHSMEVFTHYDLLNL-NGTKVAEGHKASFCLEDTECEGDIQ :: :. ::.: ::.::.:::::. :.:::::. .: ::::::::::::::. :. CCDS10 DFLPNRPRHTWEWHSCHQHYHSMDEFSHYDLLDAATGKKVAEGHKASFCLEDSTCDFGNL 440 450 460 470 480 490 670 680 690 700 710 720 pF1KE4 KNYECANFGDQGITMGCWDMYRHDIDCQWVDITDVPPGDYLFQVVINPNFEVAESDYSNN : : :.. ::.. ::.: : ::::::.::::: ::.:...: .::.. : :::..:: CCDS10 KRYACTSH-TQGLSPGCYDTYNADIDCQWIDITDVQPGNYILKVHVNPKYIVLESDFTNN 500 510 520 530 540 550 730 740 750 760 770 pF1KE4 IMKCRSRYDGHRIWMYNCHIGGSFSEETEKKFEHFSGLLNNQLSPQ ...: .: :. . ::.: CCDS10 VVRCNIHYTGRYVSATNCKIVQS 560 570 >>CCDS44490.1 DMBT1 gene_id:1755|Hs108|chr10 (2413 aa) initn: 684 init1: 351 opt: 546 Z-score: 605.2 bits: 124.4 E(32554): 2.2e-27 Smith-Waterman score: 957; 35.8% identity (59.1% similar) in 523 aa overlap (54-546:989-1482) 30 40 50 60 70 80 pF1KE4 LAQYDSWPHYPEYFQQPAPEYHQPQAPANVAKIQLRLA-GQKRKHSEGRVEVYYDGQWGT ... :::. : : .::::: :.:.::: CCDS44 VICSAAHSWSTPSPDTLPTITLPASTVGSESSLALRLVNGGDR--CQGRVEVLYQGSWGT 960 970 980 990 1000 1010 90 100 110 120 130 140 pF1KE4 VCDDDFSIHAAHVVCRELGYVEAKSWTASSSYGKGEGPIWLDNLHCTGNEATLAACTSNG ::::... . :.::::.:: : : ... .:.: ::: ::...:.:.:. : .: :: CCDS44 VCDDSWDTNDANVVCRQLGCGWAMSAPGNARFGQGSGPIVLDDVRCSGHESYLWSCPHNG 1020 1030 1040 1050 1060 1070 150 160 170 180 190 200 pF1KE4 WGVTDCKHTEDVGVVCSDKRIPGFKFDNSLINQIENLNIQVEDIRIRAILSTYRKRTPVM : .: :.::.::.:: .. .. .. . . .. .: . . : CCDS44 WLSHNCGHSEDAGVICSASQSRPTPSPDTWPTSHASTAGSESSLALRLVNGGDR-----C 1080 1090 1100 1110 1120 1130 210 220 230 240 250 260 pF1KE4 EGYVEVKEGKTWKQICDKHWTAKNSRVVCGMFGFPGERTYNTKVYKMFASRRKQRYWPFS .: ::: .: .:: .: .... ::: ..: . . .: : :. CCDS44 QGRVEVLYRGSWGTVCDDYWDTNDANVVCRQLGCGWAMSAPGN------ARFGQGSGPIV 1140 1150 1160 1170 1180 270 280 290 300 310 pF1KE4 MD---CTGTEAHISSCKLGPQVSLDPMKNVTCENGLPAVVSCVPGQ---VFSPDG-PSRF .: :.: :... :: . .: . : . : : : .: . ::: :. CCDS44 LDDVRCSGHESYLWSCPHNGWLSHN------CGHHEDAGVICSASQSQPTPSPDTWPTSH 1190 1200 1210 1220 1230 320 330 340 350 360 370 pF1KE4 RKAYKPEQPL-VRLRGGAYIGEGRVEVLKNGEWGTVCDDKWDLVSASVVCRELGFGSAKE .. :. : .:: .:. .:::::: : ::::::: :: .:.::::.:: : : CCDS44 ASTAGSESSLALRLVNGGDRCQGRVEVLYRGSWGTVCDDYWDTNDANVVCRQLGCGWATS 1240 1250 1260 1270 1280 1290 380 390 400 410 420 pF1KE4 AVTGSRLGQGIGPIHLNEIQCTGNEKSIIDCKFNAE-SQGCNHEEDAGVRCN------TP : ..:.::: ::: :....:.:.:. . .: :. :..:.:.::::: :. :: CCDS44 APGNARFGQGSGPIVLDDVRCSGHESYLWSCPHNGWLSHNCGHHEDAGVICSASQSQPTP 1300 1310 1320 1330 1340 1350 430 440 450 460 470 pF1KE4 A-----------MGLQKKL--RLNGGRNPYEGRVEVLVERNGSLVWGMVCGQNWGIVEAM . : ...: :: .: . .:::::: . :: :: :: . : .: CCDS44 SPDTWPTSHASTAGSESSLALRLVNGGDRCQGRVEVLYR--GS--WGTVCDDYWDTNDAN 1360 1370 1380 1390 1400 1410 480 490 500 510 520 530 pF1KE4 VVCRQLGLGFASNAFQETWYWHGDVNSNKVVMSGVKCSGTELSLAHCRHDGE-DVACPQG ::::::: :.:..: .. . .: :. .:.. :.::: : : : :.: . : CCDS44 VVCRQLGCGWATSAPGNARFGQG---SGPIVLDDVRCSGHESYLWSCPHNGWLSHNC--- 1420 1430 1440 1450 1460 540 550 560 570 580 590 pF1KE4 GVQYGAGVACSETAPDLVLNAEMVQQTTYLEDRPMFLLQCAMEENCLSASAAQTDPTTGY : . ::: :: . CCDS44 GHHEDAGVICSASQSQPTPSPDTWPTSRASTAGSESTLALRLVNGGDRCRGRVEVLYQGS 1470 1480 1490 1500 1510 1520 >-- initn: 898 init1: 349 opt: 527 Z-score: 583.8 bits: 120.4 E(32554): 3.4e-26 Smith-Waterman score: 859; 35.6% identity (58.5% similar) in 491 aa overlap (34-488:336-782) 10 20 30 40 50 pF1KE4 PLCSHLCSCLAMLALLSPLSLAQYDSWPHYPEYFQQPAPEYHQPQAPANVA----KIQLR :. :.:. : . :..: .. :: CCDS44 HESYLWSCPHNGWLTHNCGHSEDAGVICSAPQSRPTPSPDT-WPTSHASTAGPESSLALR 310 320 330 340 350 360 60 70 80 90 100 110 pF1KE4 LA-GQKRKHSEGRVEVYYDGQWGTVCDDDFSIHAAHVVCRELGYVEAKSWTASSSYGKGE :. : : .::::: : :.:::::::... :.::::.:: : : ... .:.: CCDS44 LVNGGDR--CQGRVEVLYRGSWGTVCDDSWDTSDANVVCRQLGCGWATSAPGNARFGQGS 370 380 390 400 410 420 120 130 140 150 160 170 pF1KE4 GPIWLDNLHCTGNEATLAACTSNGWGVTDCKHTEDVGVVCSDKRIPGFKFDNSLIN-QIE ::: ::...:.: :. : .: ::: .:.:.::.::.:: . . ..: . . CCDS44 GPIVLDDVRCSGYESYLWSCPHNGWLSHNCQHSEDAGVICSAAHSWSTPSPDTLPTITLP 430 440 450 460 470 480 180 190 200 210 220 230 pF1KE4 NLNIQVED-IRIRAILSTYRKRTPVMEGYVEVKEGKTWKQICDKHWTAKNSRVVCGMFGF .. :. . .: . . : .: ::: .: .:: : .... ::: ..: CCDS44 ASTVGSESSLALRLVNGGDR-----CQGRVEVLYRGSWGTVCDDSWDTNDANVVCRQLGC 490 500 510 520 530 240 250 260 270 280 290 pF1KE4 PGERTYNTKVYKMFA---SRRKQRYWPFSMD---CTGTEAHISSCKLGPQVSLDPMKNVT . :.: .: : :. .: :.:.:... :: . .: . CCDS44 G---------WAMLAPGNARFGQGSGPIVLDDVRCSGNESYLWSCPHNGWLSHN------ 540 550 560 570 580 300 310 320 330 340 pF1KE4 CENGLPAVVSCVPGQVFSPDGPSRFRKAYKPEQPL-VRLRGGAYIGEGRVEVLKNGEWGT : .. : : : .:: :. : .:: .:. .:::::: : ::: CCDS44 CGHSEDAGVIC--------SGP---------ESSLALRLVNGGDRCQGRVEVLYRGSWGT 590 600 610 620 350 360 370 380 390 400 pF1KE4 VCDDKWDLVSASVVCRELGFGSAKEAVTGSRLGQGIGPIHLNEIQCTGNEKSIIDCKFNA ::::.:: .:.::::.:: : : : ..:.::: ::: :....:.:.:. . .: :. CCDS44 VCDDSWDTNDANVVCRQLGCGWATSAPGNARFGQGSGPIVLDDVRCSGHESYLWSCPNNG 630 640 650 660 670 680 410 420 430 440 pF1KE4 E-SQGCNHEEDAGVRCN------TP-------------AMGLQKKL--RLNGGRNPYEGR :..:.:.::::: :. :: ..: ...: :: .: . .:: CCDS44 WLSHNCGHHEDAGVICSAAQSRSTPRPDTLSTITLPPSTVGSESSLTLRLVNGSDRCQGR 690 700 710 720 730 740 450 460 470 480 490 500 pF1KE4 VEVLVERNGSLVWGMVCGQNWGIVEAMVVCRQLGLGFASNAFQETWYWHGDVNSNKVVMS :::: . :: :: :: ..: .: ::::::: :.:..: CCDS44 VEVLYR--GS--WGTVCDDSWDTNDANVVCRQLGCGWATSAPGNARFGQGSGPIVLDDVR 750 760 770 780 790 800 510 520 530 540 550 560 pF1KE4 GVKCSGTELSLAHCRHDGEDVACPQGGVQYGAGVACSETAPDLVLNAEMVQQTTYLEDRP CCDS44 CSGHESYLWSCPHNGWLSHNCGHHEDAGVICSVSQSRPTPSPDTWPTSHASTAGPESSLA 810 820 830 840 850 860 >-- initn: 686 init1: 347 opt: 373 Z-score: 410.0 bits: 88.3 E(32554): 1.6e-16 Smith-Waterman score: 377; 37.6% identity (60.1% similar) in 178 aa overlap (260-425:163-334) 230 240 250 260 270 280 pF1KE4 VCGMFGFPGERTYNTKVYKMFASRRKQRYWPFSMD---CTGTEAHISSCKLGPQVSLDPM :...: :.: :... :: . .: . CCDS44 TNDANVVCRQLGCGWAMSAPGNAWFGQGSGPIALDDVRCSGHESYLWSCPHNGWLSHN-- 140 150 160 170 180 190 290 300 310 320 330 pF1KE4 KNVTCENGLPAVVSCVPGQVFSPDGPSRFRKAYKPEQPL--------VRLRGGAYIGEGR : .: : : : .: : : . .: : .:: .:. .:: CCDS44 ----CGHGEDAGVICSAAQPQSTLRPESWPVRISPPVPTEGSESSLALRLVNGGDRCRGR 200 210 220 230 240 340 350 360 370 380 390 pF1KE4 VEVLKNGEWGTVCDDKWDLVSASVVCRELGFGSAKEAVTGSRLGQGIGPIHLNEIQCTGN :::: : ::::::: :: .:.::::.:: : : : ....::: ::: :....:.:. CCDS44 VEVLYRGSWGTVCDDYWDTNDANVVCRQLGCGWAMSAPGNAQFGQGSGPIVLDDVRCSGH 250 260 270 280 290 300 400 410 420 430 440 450 pF1KE4 EKSIIDCKFNAE-SQGCNHEEDAGVRCNTPAMGLQKKLRLNGGRNPYEGRVEVLVERNGS :. . .: :. ...:.: ::::: :. CCDS44 ESYLWSCPHNGWLTHNCGHSEDAGVICSAPQSRPTPSPDTWPTSHASTAGPESSLALRLV 310 320 330 340 350 360 >-- initn: 898 init1: 349 opt: 361 Z-score: 396.4 bits: 85.8 E(32554): 9.2e-16 Smith-Waterman score: 398; 39.9% identity (62.3% similar) in 183 aa overlap (252-425:786-962) 230 240 250 260 270 pF1KE4 WTAKNSRVVCGMFGFPGERTYNTKVYKMFASRRKQRYWPFSMD---CTGTEAHISSCKLG .: : :. .: :.: :... :: . CCDS44 TVCDDSWDTNDANVVCRQLGCGWATSAPGNARFGQGSGPIVLDDVRCSGHESYLWSCPHN 760 770 780 790 800 810 280 290 300 310 320 330 pF1KE4 PQVSLDPMKNVTCENGLPAVVSCVPGQ---VFSPDG-PSRFRKAYKPEQPL-VRLRGGAY .: . : . : : : .: . ::: :. .. ::. : .:: .:. CCDS44 GWLSHN------CGHHEDAGVICSVSQSRPTPSPDTWPTSHASTAGPESSLALRLVNGGD 820 830 840 850 860 340 350 360 370 380 390 pF1KE4 IGEGRVEVLKNGEWGTVCDDKWDLVSASVVCRELGFGSAKEAVTGSRLGQGIGPIHLNEI .:::::: : :::::::.:: .:.::::.:: : : : ..:.::: ::: :... CCDS44 RCQGRVEVLYRGSWGTVCDDSWDTSDANVVCRQLGCGWATSAPGNARFGQGSGPIVLDDV 870 880 890 900 910 920 400 410 420 430 440 450 pF1KE4 QCTGNEKSIIDCKFNAE-SQGCNHEEDAGVRCNTPAMGLQKKLRLNGGRNPYEGRVEVLV .:.: :. . .: :. :..:.: ::::: :. CCDS44 RCSGYESYLWSCPHNGWLSHNCQHSEDAGVICSAAHSWSTPSPDTLPTITLPASTVGSES 930 940 950 960 970 980 460 470 480 490 500 510 pF1KE4 ERNGSLVWGMVCGQNWGIVEAMVVCRQLGLGFASNAFQETWYWHGDVNSNKVVMSGVKCS CCDS44 SLALRLVNGGDRCQGRVEVLYQGSWGTVCDDSWDTNDANVVCRQLGCGWAMSAPGNARFG 990 1000 1010 1020 1030 1040 >-- initn: 742 init1: 354 opt: 355 Z-score: 389.7 bits: 84.5 E(32554): 2.2e-15 Smith-Waterman score: 355; 45.4% identity (76.9% similar) in 108 aa overlap (58-163:1883-1990) 30 40 50 60 70 80 pF1KE4 DSWPHYPEYFQQPAPEYHQPQAPANVAKIQLRLAGQKRKHS--EGRVEVYYDGQWGTVCD :::.. . ... ::::.:. : :::::: CCDS44 NRMTIHFRSDISFQNTGFLAWYNSFPSDATLRLVNLNSSYGLCAGRVEIYHGGTWGTVCD 1860 1870 1880 1890 1900 1910 90 100 110 120 130 140 pF1KE4 DDFSIHAAHVVCRELGYVEAKSWTASSSYGKGEGPIWLDNLHCTGNEATLAACTSNGWGV :...:. :.::::.:: .: : ... .:.: ::: ::...:.:.:.:: : . :: CCDS44 DSWTIQEAEVVCRQLGCGRAVSALGNAYFGSGSGPITLDDVECSGTESTLWQCRNRGWFS 1920 1930 1940 1950 1960 1970 150 160 170 180 190 200 pF1KE4 TDCKHTEDVGVVCSDKRIPGFKFDNSLINQIENLNIQVEDIRIRAILSTYRKRTPVMEGY .:.: ::.::.:: ... CCDS44 HNCNHREDAGVICSGNHLSTPAPFLNITRPNTDYSCGGFLSQPSGDFSSPFYPGNYPNNA 1980 1990 2000 2010 2020 2030 >-- initn: 694 init1: 347 opt: 354 Z-score: 388.5 bits: 84.3 E(32554): 2.5e-15 Smith-Waterman score: 374; 38.4% identity (62.1% similar) in 177 aa overlap (260-425:1570-1740) 230 240 250 260 270 280 pF1KE4 VCGMFGFPGERTYNTKVYKMFASRRKQRYWPFSMD---CTGTEAHISSCKLGPQVSLDPM :. .: :.: :... :: . .: . CCDS44 TNDANVVCRQLGCGWAMSAPGNAQFGQGSGPIVLDDVRCSGHESYLWSCPHNGWLSHN-- 1540 1550 1560 1570 1580 1590 290 300 310 320 330 pF1KE4 KNVTCENGLPAVVSCVPGQVFSPDGPSRFRKAYKP------EQPL-VRLRGGAYIGEGRV : . : : : .: : :. . . : :. : .:: .:. .::: CCDS44 ----CGHHEDAGVICSAAQSQSTPRPDTWLTTNLPALTVGSESSLALRLVNGGDRCRGRV 1600 1610 1620 1630 1640 1650 340 350 360 370 380 390 pF1KE4 EVLKNGEWGTVCDDKWDLVSASVVCRELGFGSAKEAVTGSRLGQGIGPIHLNEIQCTGNE ::: : :::::::.:: .:.::::.:: : : : ..:.::: ::: :....:.::: CCDS44 EVLYRGSWGTVCDDSWDTNDANVVCRQLGCGWAMSAPGNARFGQGSGPIVLDDVRCSGNE 1660 1670 1680 1690 1700 1710 400 410 420 430 440 450 pF1KE4 KSIIDCKFNAE-SQGCNHEEDAGVRCNTPAMGLQKKLRLNGGRNPYEGRVEVLVERNGSL . . .: .. ...:.:.::::: :. CCDS44 SYLWSCPHKGWLTHNCGHHEDAGVICSATQINSTTTDWWHPTTTTTARPSSNCGGFLFYA 1720 1730 1740 1750 1760 1770 >>CCDS1171.1 CD5L gene_id:922|Hs108|chr1 (347 aa) initn: 372 init1: 213 opt: 430 Z-score: 487.2 bits: 99.8 E(32554): 8.1e-21 Smith-Waterman score: 587; 33.1% identity (57.1% similar) in 375 aa overlap (58-425:24-346) 30 40 50 60 70 80 pF1KE4 DSWPHYPEYFQQPAPEYHQPQAPANVAKIQLRLAGQKRKHSEGRVEVYYDGQWGTVCDDD .::.: .. :::::: ::::::::: CCDS11 MALLFSLILAICTRPGFLASPSGVRLVGGLHR-CEGRVEVEQKGQWGTVCDDG 10 20 30 40 50 90 100 110 120 130 140 pF1KE4 FSIHAAHVVCRELGYVEAKSWTASSSY---GKGEGPIWLDNLHCTGNEATLAACTSNGWG ..:. . :.::::: :.. .. : .. : . .... :::.: ::: : .. CCDS11 WDIKDVAVLCRELGCGAASGTPSGILYEPPAEKEQKVLIQSVSCTGTEDTLAQCEQE--E 60 70 80 90 100 110 150 160 170 180 190 200 pF1KE4 VTDCKHTEDVGVVCSDKRIPGFKFDNSLINQIENLNIQVEDIRIRAILSTYRKRTPVMEG : ::.: ::.:. : . : .: .. . : .:. : . : : CCDS11 VYDCSHDEDAGASCEN---P-----ESSFSPVP------EGVRL-ADGPGHCK------G 120 130 140 210 220 230 240 250 260 pF1KE4 YVEVKEGKTWKQICDKHWTAKNSRVVCGMFGFPGERTYNTKVYKMFASRRKQRYWPFSMD ::::. . : .:. :. . ..::: ..: :. . . : . : :: : .:. CCDS11 RVEVKHQNQWYTVCQTGWSLRAAKVVCRQLGC-GRAVLTQKRCNKHAYGRKP-IWLSQMS 150 160 170 180 190 200 270 280 290 300 310 320 pF1KE4 CTGTEAHISSCKLGPQVSLDPMKNVTCENGLPAVVSCVPGQVFSPDGPSRFRKAYKPEQP :.: :: ...: :: :: ::.. . : : :.: CCDS11 CSGREATLQDCPSGPW-----GKN-TCNHDEDTWVEC--------------------EDP 210 220 230 240 330 340 350 360 370 380 pF1KE4 L-VRLRGGAYIGEGRVEVLKNGEWGTVCDDKWDLVSASVVCRELGFGSAKEAVTGSR--L . .:: :: . ::.:::..: ::.::::.: .:::..:: :.. .: CCDS11 FDLRLVGGDNLCSGRLEVLHKGVWGSVCDDNWGEKEDQVVCKQLGCGKSLSPSFRDRKCY 250 260 270 280 290 300 390 400 410 420 430 440 pF1KE4 GQGIGPIHLNEIQCTGNEKSIIDCKFNAES-QGCNHEEDAGVRCNTPAMGLQKKLRLNGG : :.: : :....:.:.:.:. .:. . . :.:.::..: :. CCDS11 GPGVGRIWLDNVRCSGEEQSLEQCQHRFWGFHDCTHQEDVAVICSG 310 320 330 340 450 460 470 480 490 500 pF1KE4 RNPYEGRVEVLVERNGSLVWGMVCGQNWGIVEAMVVCRQLGLGFASNAFQETWYWHGDVN >>CCDS53742.1 CD163 gene_id:9332|Hs108|chr12 (1121 aa) initn: 852 init1: 401 opt: 419 Z-score: 467.0 bits: 97.7 E(32554): 1.1e-19 Smith-Waterman score: 701; 34.4% identity (56.8% similar) in 398 aa overlap (42-433:703-1035) 20 30 40 50 60 70 pF1KE4 CLAMLALLSPLSLAQYDSWPHYPEYFQQPAPEYHQPQAPANVAKIQLRLA-GQKRKHSEG : . .: : . . ::::. : : : CCDS53 PSEQVASVICSGNQSQTLSSCNSSSLGPTRPTIPEESAVACIESGQLRLVNGGGR--CAG 680 690 700 710 720 730 80 90 100 110 120 130 pF1KE4 RVEVYYDGQWGTVCDDDFSIHAAHVVCRELGYVEAKSWTASSSYGKGEGPIWLDNLHCTG :::.:..:.:::.:::.... ::::::.:: :: . :.:. .:.: ::::::...:.: CCDS53 RVEIYHEGSWGTICDDSWDLSDAHVVCRQLGCGEAINATGSAHFGEGTGPIWLDEMKCNG 740 750 760 770 780 790 140 150 160 170 180 190 pF1KE4 NEATLAACTSNGWGVTDCKHTEDVGVVCSDKRIPGFKFDNSLINQIENLNIQVEDIRIRA .:. . : :.::: .:.: ::.::.:: : . .: CCDS53 KESRIWQCHSHGWGQQNCRHKEDAGVICS------------------------EFMSLR- 800 810 820 200 210 220 230 240 250 pF1KE4 ILSTYRKRTPVMEGYVEVKEGKTWKQICDKHWTAKNSRVVCGMFGFPGERTYNTKVYKMF :.. .: . : .:: . .: . . . . ::: ..: . : CCDS53 -LTSEASRE-ACAGRLEVFYNGAWGTVGKSSMSETTVGVVCRQLGCADKGKIN------- 830 840 850 860 870 260 270 280 290 300 pF1KE4 ASRRKQRYWPFSMDCTGTEAHISSCKLGPQVSLDPM--KNVTCENGLPAVVSCVPGQVFS : :.: .:. :: :: : .: .. .: :.. . CCDS53 ---------PASLD--------------KAMSI-PMWVDNVQCPKGPDTLWQC-PSSPWE 880 890 900 910 310 320 330 340 350 360 pF1KE4 PDGPSRFRKAYKPEQPLVRLRGGAYIGEGRVEVLKNGEWGTVCDDKWDLVSASVVCRELG : .... . .::. : ::::. ..: :::::::.::: .:.:::..:: CCDS53 KRLASPSEETWITCDNKIRLQEGPTSCSGRVEIWHGGSWGTVCDDSWDLDDAQVVCQQLG 920 930 940 950 960 970 370 380 390 400 410 420 pF1KE4 FGSAKEAVTGSRLGQGIGPIHLNEIQCTGNEKSIIDCKFNAESQG---CNHEEDAGVRCN : : .: ...::: ::: :::..: :::.:. :: :. : :.:.:::.: :. CCDS53 CGPALKAFKEAEFGQGTGPIWLNEVKCKGNESSLWDCP--ARRWGHSECGHKEDAAVNCT 980 990 1000 1010 1020 430 440 450 460 470 480 pF1KE4 TPAMGLQKKLRLNGGRNPYEGRVEVLVERNGSLVWGMVCGQNWGIVEAMVVCRQLGLGFA ...:: CCDS53 D--ISVQKTPQKATTGRSSRQSSFIAVGILGVVLLAIFVALFFLTKKRRQRQRLAVSSRG 1030 1040 1050 1060 1070 1080 >-- initn: 612 init1: 381 opt: 384 Z-score: 427.5 bits: 90.4 E(32554): 1.7e-17 Smith-Waterman score: 752; 31.4% identity (55.1% similar) in 510 aa overlap (45-544:143-578) 20 30 40 50 60 70 pF1KE4 MLALLSPLSLAQYDSWPHYPEYFQQPAPEYHQPQAPANVA---KIQLRLAGQKRKHSEGR :: .: .. . ....::. . . :: CCDS53 IWMDHVSCRGNESALWDCKHDGWGKHSNCTHQQDAGVTCSDGSNLEMRLT-RGGNMCSGR 120 130 140 150 160 170 80 90 100 110 120 130 pF1KE4 VEVYYDGQWGTVCDDDFSIHAAHVVCRELGYVEAKSWTASSSYGKGEGPIWLDNLHCTGN .:. ..:.:::::::.:.: : :.::.: : :...::..:.: ::::.:.: :.:: CCDS53 IEIKFQGRWGTVCDDNFNIDHASVICRQLECGSAVSFSGSSNFGEGSGPIWFDDLICNGN 180 190 200 210 220 230 140 150 160 170 180 190 pF1KE4 EATLAACTSNGWGVTDCKHTEDVGVVCSDKRIPGFKFDNSLINQIENLNIQVEDIRIRAI :..: : .::: .: :.::.::.:: : .. :.. . . . CCDS53 ESALWNCKHQGWGKHNCDHAEDAGVICSK----GADLSLRLVDGVTECS----------- 240 250 260 270 200 210 220 230 240 250 pF1KE4 LSTYRKRTPVMEGYVEVKEGKTWKQICDKHWTAKNSRVVCGMFGFPGERTYNTKVYKMFA : .::. : ::: : . .. :.: ..: : : : . .. : CCDS53 ------------GRLEVRFQGEWGTICDDGWDSYDAAVACKQLGCP---TAVTAIGRVNA 280 290 300 310 320 260 270 280 290 300 310 pF1KE4 SRRKQRYWPFSMDCTGTEAHISSCKLGPQVSLDPMKNVTCENGLPAVVSCVPGQVFSPDG :. . : :..: : : : .:: . :. :... : :.: :. . CCDS53 SKGFGHIWLDSVSCQGHEPAIWQCK-----HHEWGKHY-CNHNEDAGVTCSDGSDLE--- 330 340 350 360 370 320 330 340 350 360 370 pF1KE4 PSRFRKAYKPEQPLVRLRGGAYIGEGRVEVLKNGEWGTVCDDKWDLVSASVVCRELGFGS .:::::. : ::: . : ::: : : :.::::.:: :: CCDS53 --------------LRLRGGGSRCAGTVEVEIQRLLGKVCDRGWGLKEADVVCRQLGCGS 380 390 400 410 380 390 400 410 420 pF1KE4 AKEAV--TGSRLGQGIGPIHLNEIQCTGNEKSIIDCKFNAESQG--CNHEEDAGVRCNTP : .. . :.. . :. .:.::: :. ::: : . : :.: :.: . :.. CCDS53 ALKTSYQVYSKIQATNTWLFLS--SCNGNETSLWDCK-NWQWGGLTCDHYEEAKITCSA- 420 430 440 450 460 470 430 440 450 460 470 480 pF1KE4 AMGLQKKLRLNGGRNPYEGRVEVLVERNGSLVWGMVCGQNWGIVEAMVVCRQLGLGFASN ... :: :: : ::::: ..:. .:: .: ..... : :.::.: : . . CCDS53 ----HREPRLVGGDIPCSGRVEV---KHGD-TWGSICDSDFSLEAASVLCRELQCGTVVS 480 490 500 510 520 490 500 510 520 530 540 pF1KE4 AFQETWYWHGDVNSNKVVMSGVKCSGTELSLAHCRHDGEDVAC-PQGGVQYG--AGVACS . . . .:. ... .: : : :. : :: :.: ... .::.:: CCDS53 ILGGAHFGEGN---GQIWAEEFQCEGHESHLSLC-----PVAPRPEGTCSHSRDVGVVCS 530 540 550 560 570 550 560 570 580 590 600 pF1KE4 ETAPDLVLNAEMVQQTTYLEDRPMFLLQCAMEENCLSASAAQTDPTTGYRRLLRFSSQIH CCDS53 RYTEIRLVNGKTPCEGRVELKTLGAWGSLCNSHWDIEDAHVLCQQLKCGVALSTPGGARF 580 590 600 610 620 630 >>CCDS8578.1 CD163 gene_id:9332|Hs108|chr12 (1156 aa) initn: 852 init1: 401 opt: 419 Z-score: 466.8 bits: 97.7 E(32554): 1.1e-19 Smith-Waterman score: 701; 34.4% identity (56.8% similar) in 398 aa overlap (42-433:703-1035) 20 30 40 50 60 70 pF1KE4 CLAMLALLSPLSLAQYDSWPHYPEYFQQPAPEYHQPQAPANVAKIQLRLA-GQKRKHSEG : . .: : . . ::::. : : : CCDS85 PSEQVASVICSGNQSQTLSSCNSSSLGPTRPTIPEESAVACIESGQLRLVNGGGR--CAG 680 690 700 710 720 730 80 90 100 110 120 130 pF1KE4 RVEVYYDGQWGTVCDDDFSIHAAHVVCRELGYVEAKSWTASSSYGKGEGPIWLDNLHCTG :::.:..:.:::.:::.... ::::::.:: :: . :.:. .:.: ::::::...:.: CCDS85 RVEIYHEGSWGTICDDSWDLSDAHVVCRQLGCGEAINATGSAHFGEGTGPIWLDEMKCNG 740 750 760 770 780 790 140 150 160 170 180 190 pF1KE4 NEATLAACTSNGWGVTDCKHTEDVGVVCSDKRIPGFKFDNSLINQIENLNIQVEDIRIRA .:. . : :.::: .:.: ::.::.:: : . .: CCDS85 KESRIWQCHSHGWGQQNCRHKEDAGVICS------------------------EFMSLR- 800 810 820 200 210 220 230 240 250 pF1KE4 ILSTYRKRTPVMEGYVEVKEGKTWKQICDKHWTAKNSRVVCGMFGFPGERTYNTKVYKMF :.. .: . : .:: . .: . . . . ::: ..: . : CCDS85 -LTSEASRE-ACAGRLEVFYNGAWGTVGKSSMSETTVGVVCRQLGCADKGKIN------- 830 840 850 860 870 260 270 280 290 300 pF1KE4 ASRRKQRYWPFSMDCTGTEAHISSCKLGPQVSLDPM--KNVTCENGLPAVVSCVPGQVFS : :.: .:. :: :: : .: .. .: :.. . CCDS85 ---------PASLD--------------KAMSI-PMWVDNVQCPKGPDTLWQC-PSSPWE 880 890 900 910 310 320 330 340 350 360 pF1KE4 PDGPSRFRKAYKPEQPLVRLRGGAYIGEGRVEVLKNGEWGTVCDDKWDLVSASVVCRELG : .... . .::. : ::::. ..: :::::::.::: .:.:::..:: CCDS85 KRLASPSEETWITCDNKIRLQEGPTSCSGRVEIWHGGSWGTVCDDSWDLDDAQVVCQQLG 920 930 940 950 960 970 370 380 390 400 410 420 pF1KE4 FGSAKEAVTGSRLGQGIGPIHLNEIQCTGNEKSIIDCKFNAESQG---CNHEEDAGVRCN : : .: ...::: ::: :::..: :::.:. :: :. : :.:.:::.: :. CCDS85 CGPALKAFKEAEFGQGTGPIWLNEVKCKGNESSLWDCP--ARRWGHSECGHKEDAAVNCT 980 990 1000 1010 1020 430 440 450 460 470 480 pF1KE4 TPAMGLQKKLRLNGGRNPYEGRVEVLVERNGSLVWGMVCGQNWGIVEAMVVCRQLGLGFA ...:: CCDS85 D--ISVQKTPQKATTGRSSRQSSFIAVGILGVVLLAIFVALFFLTKKRRQRQRLAVSSRG 1030 1040 1050 1060 1070 1080 >-- initn: 612 init1: 381 opt: 384 Z-score: 427.3 bits: 90.4 E(32554): 1.8e-17 Smith-Waterman score: 752; 31.4% identity (55.1% similar) in 510 aa overlap (45-544:143-578) 20 30 40 50 60 70 pF1KE4 MLALLSPLSLAQYDSWPHYPEYFQQPAPEYHQPQAPANVA---KIQLRLAGQKRKHSEGR :: .: .. . ....::. . . :: CCDS85 IWMDHVSCRGNESALWDCKHDGWGKHSNCTHQQDAGVTCSDGSNLEMRLT-RGGNMCSGR 120 130 140 150 160 170 80 90 100 110 120 130 pF1KE4 VEVYYDGQWGTVCDDDFSIHAAHVVCRELGYVEAKSWTASSSYGKGEGPIWLDNLHCTGN .:. ..:.:::::::.:.: : :.::.: : :...::..:.: ::::.:.: :.:: CCDS85 IEIKFQGRWGTVCDDNFNIDHASVICRQLECGSAVSFSGSSNFGEGSGPIWFDDLICNGN 180 190 200 210 220 230 140 150 160 170 180 190 pF1KE4 EATLAACTSNGWGVTDCKHTEDVGVVCSDKRIPGFKFDNSLINQIENLNIQVEDIRIRAI :..: : .::: .: :.::.::.:: : .. :.. . . . CCDS85 ESALWNCKHQGWGKHNCDHAEDAGVICSK----GADLSLRLVDGVTECS----------- 240 250 260 270 200 210 220 230 240 250 pF1KE4 LSTYRKRTPVMEGYVEVKEGKTWKQICDKHWTAKNSRVVCGMFGFPGERTYNTKVYKMFA : .::. : ::: : . .. :.: ..: : : : . .. : CCDS85 ------------GRLEVRFQGEWGTICDDGWDSYDAAVACKQLGCP---TAVTAIGRVNA 280 290 300 310 320 260 270 280 290 300 310 pF1KE4 SRRKQRYWPFSMDCTGTEAHISSCKLGPQVSLDPMKNVTCENGLPAVVSCVPGQVFSPDG :. . : :..: : : : .:: . :. :... : :.: :. . CCDS85 SKGFGHIWLDSVSCQGHEPAIWQCK-----HHEWGKHY-CNHNEDAGVTCSDGSDLE--- 330 340 350 360 370 320 330 340 350 360 370 pF1KE4 PSRFRKAYKPEQPLVRLRGGAYIGEGRVEVLKNGEWGTVCDDKWDLVSASVVCRELGFGS .:::::. : ::: . : ::: : : :.::::.:: :: CCDS85 --------------LRLRGGGSRCAGTVEVEIQRLLGKVCDRGWGLKEADVVCRQLGCGS 380 390 400 410 380 390 400 410 420 pF1KE4 AKEAV--TGSRLGQGIGPIHLNEIQCTGNEKSIIDCKFNAESQG--CNHEEDAGVRCNTP : .. . :.. . :. .:.::: :. ::: : . : :.: :.: . :.. CCDS85 ALKTSYQVYSKIQATNTWLFLS--SCNGNETSLWDCK-NWQWGGLTCDHYEEAKITCSA- 420 430 440 450 460 470 430 440 450 460 470 480 pF1KE4 AMGLQKKLRLNGGRNPYEGRVEVLVERNGSLVWGMVCGQNWGIVEAMVVCRQLGLGFASN ... :: :: : ::::: ..:. .:: .: ..... : :.::.: : . . CCDS85 ----HREPRLVGGDIPCSGRVEV---KHGD-TWGSICDSDFSLEAASVLCRELQCGTVVS 480 490 500 510 520 490 500 510 520 530 540 pF1KE4 AFQETWYWHGDVNSNKVVMSGVKCSGTELSLAHCRHDGEDVAC-PQGGVQYG--AGVACS . . . .:. ... .: : : :. : :: :.: ... .::.:: CCDS85 ILGGAHFGEGN---GQIWAEEFQCEGHESHLSLC-----PVAPRPEGTCSHSRDVGVVCS 530 540 550 560 570 550 560 570 580 590 600 pF1KE4 ETAPDLVLNAEMVQQTTYLEDRPMFLLQCAMEENCLSASAAQTDPTTGYRRLLRFSSQIH CCDS85 RYTEIRLVNGKTPCEGRVELKTLGAWGSLCNSHWDIEDAHVLCQQLKCGVALSTPGGARF 580 590 600 610 620 630 774 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 18:37:47 2016 done: Mon Nov 7 18:37:48 2016 Total Scan time: 3.270 Total Display time: 0.230 Function used was FASTA [36.3.4 Apr, 2011]