FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1374, 428 aa 1>>>pF1KE1374 428 - 428 aa - 428 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 8.5904+/-0.000861; mu= 1.9556+/- 0.052 mean_var=152.4542+/-31.236, 0's: 0 Z-trim(112.2): 18 B-trim: 50 in 1/49 Lambda= 0.103873 statistics sampled from 12967 (12983) to 12967 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.752), E-opt: 0.2 (0.399), width: 16 Scan time: 3.410 The best scores are: opt bits E(32554) CCDS12107.1 NFIC gene_id:4782|Hs108|chr19 ( 428) 2912 447.9 8.6e-126 CCDS59331.1 NFIC gene_id:4782|Hs108|chr19 ( 439) 2871 441.8 6.2e-124 CCDS59330.1 NFIC gene_id:4782|Hs108|chr19 ( 508) 2871 441.8 7.1e-124 CCDS58640.1 NFIC gene_id:4782|Hs108|chr19 ( 430) 2801 431.3 8.8e-121 CCDS45914.1 NFIC gene_id:4782|Hs108|chr19 ( 499) 2801 431.3 1e-120 CCDS615.1 NFIA gene_id:4774|Hs108|chr1 ( 498) 1700 266.3 4.7e-71 CCDS44156.1 NFIA gene_id:4774|Hs108|chr1 ( 509) 1700 266.3 4.7e-71 CCDS53322.1 NFIA gene_id:4774|Hs108|chr1 ( 554) 1700 266.3 5.1e-71 CCDS53321.1 NFIA gene_id:4774|Hs108|chr1 ( 501) 1647 258.4 1.2e-68 CCDS45996.1 NFIX gene_id:4784|Hs108|chr19 ( 441) 1617 253.9 2.3e-67 CCDS6474.1 NFIB gene_id:4781|Hs108|chr9 ( 420) 1580 248.3 1e-65 CCDS59359.1 NFIX gene_id:4784|Hs108|chr19 ( 433) 1570 246.8 3e-65 CCDS55291.1 NFIB gene_id:4781|Hs108|chr9 ( 494) 1541 242.5 6.9e-64 CCDS55292.1 NFIB gene_id:4781|Hs108|chr9 ( 446) 1537 241.9 9.5e-64 CCDS65007.1 NFIB gene_id:4781|Hs108|chr9 ( 309) 488 84.6 1.4e-16 >>CCDS12107.1 NFIC gene_id:4782|Hs108|chr19 (428 aa) initn: 2912 init1: 2912 opt: 2912 Z-score: 2371.9 bits: 447.9 E(32554): 8.6e-126 Smith-Waterman score: 2912; 100.0% identity (100.0% similar) in 428 aa overlap (1-428:1-428) 10 20 30 40 50 60 pF1KE1 MYSSPLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKDEERAVKDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 MYSSPLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKDEERAVKDE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 LLGEKPEVKQKWASRLLAKLRKDIRPECREDFVLSITGKKAPGCVLSNPDQKGKMRRIDC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LLGEKPEVKQKWASRLLAKLRKDIRPECREDFVLSITGKKAPGCVLSNPDQKGKMRRIDC 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 LRQADKVWRLDLVMVILFKGIPLESTDGERLVKAAQCGHPVLCVQPHHIGVAVKELDLYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 LRQADKVWRLDLVMVILFKGIPLESTDGERLVKAAQCGHPVLCVQPHHIGVAVKELDLYL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 AYFVRERDAEQSGSPRTGMGSDQEDSKPITLDTTDFQESFVTSGVFSVTELIQVSRTPVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 AYFVRERDAEQSGSPRTGMGSDQEDSKPITLDTTDFQESFVTSGVFSVTELIQVSRTPVV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 TGTGPNFSLGELQGHLAYDLNPASTGLRRTLPSTSSSGSKRHKSGSMEEDVDTSPGGDYY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 TGTGPNFSLGELQGHLAYDLNPASTGLRRTLPSTSSSGSKRHKSGSMEEDVDTSPGGDYY 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 TSPSSPTSSSRNWTEDMEGGISSPVKKTEMDKSPFNSPSPQDSPRLSSFTQHHRPVIAVH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 TSPSSPTSSSRNWTEDMEGGISSPVKKTEMDKSPFNSPSPQDSPRLSSFTQHHRPVIAVH 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE1 SGIARSPHPSSALHFPTTSILPQTASTYFPHTAIRYPPHLNPQDPLKDLVSLACDPASQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS12 SGIARSPHPSSALHFPTTSILPQTASTYFPHTAIRYPPHLNPQDPLKDLVSLACDPASQQ 370 380 390 400 410 420 pF1KE1 PGPSWYLG :::::::: CCDS12 PGPSWYLG >>CCDS59331.1 NFIC gene_id:4782|Hs108|chr19 (439 aa) initn: 2871 init1: 2871 opt: 2871 Z-score: 2338.5 bits: 441.8 E(32554): 6.2e-124 Smith-Waterman score: 2871; 100.0% identity (100.0% similar) in 423 aa overlap (1-423:1-423) 10 20 30 40 50 60 pF1KE1 MYSSPLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKDEERAVKDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 MYSSPLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKDEERAVKDE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 LLGEKPEVKQKWASRLLAKLRKDIRPECREDFVLSITGKKAPGCVLSNPDQKGKMRRIDC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 LLGEKPEVKQKWASRLLAKLRKDIRPECREDFVLSITGKKAPGCVLSNPDQKGKMRRIDC 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 LRQADKVWRLDLVMVILFKGIPLESTDGERLVKAAQCGHPVLCVQPHHIGVAVKELDLYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 LRQADKVWRLDLVMVILFKGIPLESTDGERLVKAAQCGHPVLCVQPHHIGVAVKELDLYL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 AYFVRERDAEQSGSPRTGMGSDQEDSKPITLDTTDFQESFVTSGVFSVTELIQVSRTPVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 AYFVRERDAEQSGSPRTGMGSDQEDSKPITLDTTDFQESFVTSGVFSVTELIQVSRTPVV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 TGTGPNFSLGELQGHLAYDLNPASTGLRRTLPSTSSSGSKRHKSGSMEEDVDTSPGGDYY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 TGTGPNFSLGELQGHLAYDLNPASTGLRRTLPSTSSSGSKRHKSGSMEEDVDTSPGGDYY 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 TSPSSPTSSSRNWTEDMEGGISSPVKKTEMDKSPFNSPSPQDSPRLSSFTQHHRPVIAVH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 TSPSSPTSSSRNWTEDMEGGISSPVKKTEMDKSPFNSPSPQDSPRLSSFTQHHRPVIAVH 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE1 SGIARSPHPSSALHFPTTSILPQTASTYFPHTAIRYPPHLNPQDPLKDLVSLACDPASQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 SGIARSPHPSSALHFPTTSILPQTASTYFPHTAIRYPPHLNPQDPLKDLVSLACDPASQQ 370 380 390 400 410 420 pF1KE1 PGPSWYLG ::: CCDS59 PGPPTLRPTRPLQTVPLWD 430 >>CCDS59330.1 NFIC gene_id:4782|Hs108|chr19 (508 aa) initn: 2871 init1: 2871 opt: 2871 Z-score: 2337.5 bits: 441.8 E(32554): 7.1e-124 Smith-Waterman score: 2871; 100.0% identity (100.0% similar) in 423 aa overlap (1-423:1-423) 10 20 30 40 50 60 pF1KE1 MYSSPLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKDEERAVKDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 MYSSPLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKDEERAVKDE 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 LLGEKPEVKQKWASRLLAKLRKDIRPECREDFVLSITGKKAPGCVLSNPDQKGKMRRIDC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 LLGEKPEVKQKWASRLLAKLRKDIRPECREDFVLSITGKKAPGCVLSNPDQKGKMRRIDC 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 LRQADKVWRLDLVMVILFKGIPLESTDGERLVKAAQCGHPVLCVQPHHIGVAVKELDLYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 LRQADKVWRLDLVMVILFKGIPLESTDGERLVKAAQCGHPVLCVQPHHIGVAVKELDLYL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 AYFVRERDAEQSGSPRTGMGSDQEDSKPITLDTTDFQESFVTSGVFSVTELIQVSRTPVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 AYFVRERDAEQSGSPRTGMGSDQEDSKPITLDTTDFQESFVTSGVFSVTELIQVSRTPVV 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE1 TGTGPNFSLGELQGHLAYDLNPASTGLRRTLPSTSSSGSKRHKSGSMEEDVDTSPGGDYY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 TGTGPNFSLGELQGHLAYDLNPASTGLRRTLPSTSSSGSKRHKSGSMEEDVDTSPGGDYY 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE1 TSPSSPTSSSRNWTEDMEGGISSPVKKTEMDKSPFNSPSPQDSPRLSSFTQHHRPVIAVH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 TSPSSPTSSSRNWTEDMEGGISSPVKKTEMDKSPFNSPSPQDSPRLSSFTQHHRPVIAVH 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE1 SGIARSPHPSSALHFPTTSILPQTASTYFPHTAIRYPPHLNPQDPLKDLVSLACDPASQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS59 SGIARSPHPSSALHFPTTSILPQTASTYFPHTAIRYPPHLNPQDPLKDLVSLACDPASQQ 370 380 390 400 410 420 pF1KE1 PGPSWYLG ::: CCDS59 PGPLNGSGQLKMPSHCLSAQMLAPPPPGLPRLALPPATKPATTSEGGATSPTSPSYSPPD 430 440 450 460 470 480 >>CCDS58640.1 NFIC gene_id:4782|Hs108|chr19 (430 aa) initn: 2801 init1: 2801 opt: 2801 Z-score: 2281.9 bits: 431.3 E(32554): 8.8e-121 Smith-Waterman score: 2801; 100.0% identity (100.0% similar) in 413 aa overlap (11-423:2-414) 10 20 30 40 50 60 pF1KE1 MYSSPLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKDEERAVKDE :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 MDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKDEERAVKDE 10 20 30 40 50 70 80 90 100 110 120 pF1KE1 LLGEKPEVKQKWASRLLAKLRKDIRPECREDFVLSITGKKAPGCVLSNPDQKGKMRRIDC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 LLGEKPEVKQKWASRLLAKLRKDIRPECREDFVLSITGKKAPGCVLSNPDQKGKMRRIDC 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE1 LRQADKVWRLDLVMVILFKGIPLESTDGERLVKAAQCGHPVLCVQPHHIGVAVKELDLYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 LRQADKVWRLDLVMVILFKGIPLESTDGERLVKAAQCGHPVLCVQPHHIGVAVKELDLYL 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE1 AYFVRERDAEQSGSPRTGMGSDQEDSKPITLDTTDFQESFVTSGVFSVTELIQVSRTPVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 AYFVRERDAEQSGSPRTGMGSDQEDSKPITLDTTDFQESFVTSGVFSVTELIQVSRTPVV 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE1 TGTGPNFSLGELQGHLAYDLNPASTGLRRTLPSTSSSGSKRHKSGSMEEDVDTSPGGDYY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 TGTGPNFSLGELQGHLAYDLNPASTGLRRTLPSTSSSGSKRHKSGSMEEDVDTSPGGDYY 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE1 TSPSSPTSSSRNWTEDMEGGISSPVKKTEMDKSPFNSPSPQDSPRLSSFTQHHRPVIAVH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 TSPSSPTSSSRNWTEDMEGGISSPVKKTEMDKSPFNSPSPQDSPRLSSFTQHHRPVIAVH 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE1 SGIARSPHPSSALHFPTTSILPQTASTYFPHTAIRYPPHLNPQDPLKDLVSLACDPASQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS58 SGIARSPHPSSALHFPTTSILPQTASTYFPHTAIRYPPHLNPQDPLKDLVSLACDPASQQ 360 370 380 390 400 410 pF1KE1 PGPSWYLG ::: CCDS58 PGPPTLRPTRPLQTVPLWD 420 430 >>CCDS45914.1 NFIC gene_id:4782|Hs108|chr19 (499 aa) initn: 2801 init1: 2801 opt: 2801 Z-score: 2280.9 bits: 431.3 E(32554): 1e-120 Smith-Waterman score: 2801; 100.0% identity (100.0% similar) in 413 aa overlap (11-423:2-414) 10 20 30 40 50 60 pF1KE1 MYSSPLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKDEERAVKDE :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 MDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKDEERAVKDE 10 20 30 40 50 70 80 90 100 110 120 pF1KE1 LLGEKPEVKQKWASRLLAKLRKDIRPECREDFVLSITGKKAPGCVLSNPDQKGKMRRIDC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 LLGEKPEVKQKWASRLLAKLRKDIRPECREDFVLSITGKKAPGCVLSNPDQKGKMRRIDC 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE1 LRQADKVWRLDLVMVILFKGIPLESTDGERLVKAAQCGHPVLCVQPHHIGVAVKELDLYL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 LRQADKVWRLDLVMVILFKGIPLESTDGERLVKAAQCGHPVLCVQPHHIGVAVKELDLYL 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE1 AYFVRERDAEQSGSPRTGMGSDQEDSKPITLDTTDFQESFVTSGVFSVTELIQVSRTPVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 AYFVRERDAEQSGSPRTGMGSDQEDSKPITLDTTDFQESFVTSGVFSVTELIQVSRTPVV 180 190 200 210 220 230 250 260 270 280 290 300 pF1KE1 TGTGPNFSLGELQGHLAYDLNPASTGLRRTLPSTSSSGSKRHKSGSMEEDVDTSPGGDYY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 TGTGPNFSLGELQGHLAYDLNPASTGLRRTLPSTSSSGSKRHKSGSMEEDVDTSPGGDYY 240 250 260 270 280 290 310 320 330 340 350 360 pF1KE1 TSPSSPTSSSRNWTEDMEGGISSPVKKTEMDKSPFNSPSPQDSPRLSSFTQHHRPVIAVH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 TSPSSPTSSSRNWTEDMEGGISSPVKKTEMDKSPFNSPSPQDSPRLSSFTQHHRPVIAVH 300 310 320 330 340 350 370 380 390 400 410 420 pF1KE1 SGIARSPHPSSALHFPTTSILPQTASTYFPHTAIRYPPHLNPQDPLKDLVSLACDPASQQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS45 SGIARSPHPSSALHFPTTSILPQTASTYFPHTAIRYPPHLNPQDPLKDLVSLACDPASQQ 360 370 380 390 400 410 pF1KE1 PGPSWYLG ::: CCDS45 PGPLNGSGQLKMPSHCLSAQMLAPPPPGLPRLALPPATKPATTSEGGATSPTSPSYSPPD 420 430 440 450 460 470 >>CCDS615.1 NFIA gene_id:4774|Hs108|chr1 (498 aa) initn: 1524 init1: 1187 opt: 1700 Z-score: 1389.2 bits: 266.3 E(32554): 4.7e-71 Smith-Waterman score: 1756; 66.0% identity (81.8% similar) in 435 aa overlap (1-427:1-417) 10 20 30 40 50 60 pF1KE1 MYSSPLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKDEERAVKDE ::: :::::::::::::::::::::::::::::::::::::::::::::::.:::::::: CCDS61 MYS-PLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKEEERAVKDE 10 20 30 40 50 70 80 90 100 110 120 pF1KE1 LLGEKPEVKQKWASRLLAKLRKDIRPECREDFVLSITGKKAPGCVLSNPDQKGKMRRIDC ::.:::::::::::::::::::::::: ::::::..:::: : ::::::::::::::::: CCDS61 LLSEKPEVKQKWASRLLAKLRKDIRPEYREDFVLTVTGKKPPCCVLSNPDQKGKMRRIDC 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE1 LRQADKVWRLDLVMVILFKGIPLESTDGERLVKAAQCGHPVLCVQPHHIGVAVKELDLYL :::::::::::::::::::::::::::::::::. ::..: ::::::::::.:::::::: CCDS61 LRQADKVWRLDLVMVILFKGIPLESTDGERLVKSPQCSNPGLCVQPHHIGVSVKELDLYL 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE1 AYFVRERDAEQSGSPRTGMGSDQEDSKPITLDTTDFQESFVTSGVFSVTELIQVSRTPVV ::::. :. :: :: .: .: .: . ::.:::::::::::::..::.::.. CCDS61 AYFVHAADSSQSESPSQPSDADIKD-QPEN-GHLGFQDSFVTSGVFSVTELVRVSQTPIA 180 190 200 210 220 230 250 260 270 280 290 pF1KE1 TGTGPNFSLGELQGHLAYDLNPASTGLRRTLPSTSSSGS-KRHKSGSMEEDVDTSPGGD- .::::::::..:.. :...:.. .::.::::::..: :: :: .:...: ::: . CCDS61 AGTGPNFSLSDLESSSYYSMSPGA--MRRSLPSTSSTSSTKRLKS--VEDEMD-SPGEEP 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE1 YYT----SPSSPTSSSRNWTEDMEGGISSPVKKTEMDKSPFNSPSPQDSPRL-SSFTQHH .:: ::.: ..:: .: : .: :. ::. . .:: :.::::... : ..::::: CCDS61 FYTGQGRSPGSGSQSS-GWHE-VEPGMPSPTTLKKSEKSGFSSPSPSQTSSLGTAFTQHH 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE1 RPVIAVHSGIARSPHPS-SALHFPTTSILPQTASTYFPHTAIRYPPHLNPQDPLKDLVSL :::: .: ::: . :.:::::. :. : . :: : :::: .::. ::..:.: CCDS61 RPVI---TGPRASPHATPSTLHFPTSPIIQQPGP-YFSHPAIRY----HPQETLKEFVQL 360 370 380 390 400 420 pF1KE1 ACDPASQQPGPSWYLG .: :.:: : .: CCDS61 VCPDAGQQAGQVGFLNPNGSSQGKVHNPFLPTPMLPPPPPPPMARPVPLPVPDTKPPTTS 410 420 430 440 450 460 >>CCDS44156.1 NFIA gene_id:4774|Hs108|chr1 (509 aa) initn: 1554 init1: 1187 opt: 1700 Z-score: 1389.0 bits: 266.3 E(32554): 4.7e-71 Smith-Waterman score: 1756; 66.0% identity (81.8% similar) in 435 aa overlap (1-427:1-417) 10 20 30 40 50 60 pF1KE1 MYSSPLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKDEERAVKDE ::: :::::::::::::::::::::::::::::::::::::::::::::::.:::::::: CCDS44 MYS-PLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKEEERAVKDE 10 20 30 40 50 70 80 90 100 110 120 pF1KE1 LLGEKPEVKQKWASRLLAKLRKDIRPECREDFVLSITGKKAPGCVLSNPDQKGKMRRIDC ::.:::::::::::::::::::::::: ::::::..:::: : ::::::::::::::::: CCDS44 LLSEKPEVKQKWASRLLAKLRKDIRPEYREDFVLTVTGKKPPCCVLSNPDQKGKMRRIDC 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE1 LRQADKVWRLDLVMVILFKGIPLESTDGERLVKAAQCGHPVLCVQPHHIGVAVKELDLYL :::::::::::::::::::::::::::::::::. ::..: ::::::::::.:::::::: CCDS44 LRQADKVWRLDLVMVILFKGIPLESTDGERLVKSPQCSNPGLCVQPHHIGVSVKELDLYL 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE1 AYFVRERDAEQSGSPRTGMGSDQEDSKPITLDTTDFQESFVTSGVFSVTELIQVSRTPVV ::::. :. :: :: .: .: .: . ::.:::::::::::::..::.::.. CCDS44 AYFVHAADSSQSESPSQPSDADIKD-QPEN-GHLGFQDSFVTSGVFSVTELVRVSQTPIA 180 190 200 210 220 230 250 260 270 280 290 pF1KE1 TGTGPNFSLGELQGHLAYDLNPASTGLRRTLPSTSSSGS-KRHKSGSMEEDVDTSPGGD- .::::::::..:.. :...:.. .::.::::::..: :: :: .:...: ::: . CCDS44 AGTGPNFSLSDLESSSYYSMSPGA--MRRSLPSTSSTSSTKRLKS--VEDEMD-SPGEEP 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE1 YYT----SPSSPTSSSRNWTEDMEGGISSPVKKTEMDKSPFNSPSPQDSPRL-SSFTQHH .:: ::.: ..:: .: : .: :. ::. . .:: :.::::... : ..::::: CCDS44 FYTGQGRSPGSGSQSS-GWHE-VEPGMPSPTTLKKSEKSGFSSPSPSQTSSLGTAFTQHH 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE1 RPVIAVHSGIARSPHPS-SALHFPTTSILPQTASTYFPHTAIRYPPHLNPQDPLKDLVSL :::: .: ::: . :.:::::. :. : . :: : :::: .::. ::..:.: CCDS44 RPVI---TGPRASPHATPSTLHFPTSPIIQQPGP-YFSHPAIRY----HPQETLKEFVQL 360 370 380 390 400 420 pF1KE1 ACDPASQQPGPSWYLG .: :.:: : .: CCDS44 VCPDAGQQAGQVGFLNPNGSSQGKVHNPFLPTPMLPPPPPPPMARPVPLPVPDTKPPTTS 410 420 430 440 450 460 >>CCDS53322.1 NFIA gene_id:4774|Hs108|chr1 (554 aa) initn: 1554 init1: 1187 opt: 1700 Z-score: 1388.5 bits: 266.3 E(32554): 5.1e-71 Smith-Waterman score: 1756; 66.0% identity (81.8% similar) in 435 aa overlap (1-427:46-462) 10 20 30 pF1KE1 MYSSPLCLTQDEFHPFIEALLPHVRAFAYT ::: :::::::::::::::::::::::::: CCDS53 TRWPGGCGATWQSCPSPPPRRTRIPQRPAVMYS-PLCLTQDEFHPFIEALLPHVRAFAYT 20 30 40 50 60 70 40 50 60 70 80 90 pF1KE1 WFNLQARKRKYFKKHEKRMSKDEERAVKDELLGEKPEVKQKWASRLLAKLRKDIRPECRE :::::::::::::::::::::.::::::::::.:::::::::::::::::::::::: :: CCDS53 WFNLQARKRKYFKKHEKRMSKEEERAVKDELLSEKPEVKQKWASRLLAKLRKDIRPEYRE 80 90 100 110 120 130 100 110 120 130 140 150 pF1KE1 DFVLSITGKKAPGCVLSNPDQKGKMRRIDCLRQADKVWRLDLVMVILFKGIPLESTDGER ::::..:::: : ::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 DFVLTVTGKKPPCCVLSNPDQKGKMRRIDCLRQADKVWRLDLVMVILFKGIPLESTDGER 140 150 160 170 180 190 160 170 180 190 200 210 pF1KE1 LVKAAQCGHPVLCVQPHHIGVAVKELDLYLAYFVRERDAEQSGSPRTGMGSDQEDSKPIT :::. ::..: ::::::::::.::::::::::::. :. :: :: .: .: .: . CCDS53 LVKSPQCSNPGLCVQPHHIGVSVKELDLYLAYFVHAADSSQSESPSQPSDADIKD-QPEN 200 210 220 230 240 250 220 230 240 250 260 270 pF1KE1 LDTTDFQESFVTSGVFSVTELIQVSRTPVVTGTGPNFSLGELQGHLAYDLNPASTGLRRT ::.:::::::::::::..::.::...::::::::..:.. :...:.. .::. CCDS53 -GHLGFQDSFVTSGVFSVTELVRVSQTPIAAGTGPNFSLSDLESSSYYSMSPGA--MRRS 260 270 280 290 300 310 280 290 300 310 320 pF1KE1 LPSTSSSGS-KRHKSGSMEEDVDTSPGGD-YYT----SPSSPTSSSRNWTEDMEGGISSP ::::::..: :: :: .:...: ::: . .:: ::.: ..:: .: : .: :. :: CCDS53 LPSTSSTSSTKRLKS--VEDEMD-SPGEEPFYTGQGRSPGSGSQSS-GWHE-VEPGMPSP 320 330 340 350 360 330 340 350 360 370 380 pF1KE1 VKKTEMDKSPFNSPSPQDSPRL-SSFTQHHRPVIAVHSGIARSPHPS-SALHFPTTSILP . . .:: :.::::... : ..::::::::: .: ::: . :.:::::. :. CCDS53 TTLKKSEKSGFSSPSPSQTSSLGTAFTQHHRPVI---TGPRASPHATPSTLHFPTSPIIQ 370 380 390 400 410 420 390 400 410 420 pF1KE1 QTASTYFPHTAIRYPPHLNPQDPLKDLVSLACDPASQQPGPSWYLG : . :: : :::: .::. ::..:.:.: :.:: : .: CCDS53 QPGP-YFSHPAIRY----HPQETLKEFVQLVCPDAGQQAGQVGFLNPNGSSQGKVHNPFL 430 440 450 460 470 CCDS53 PTPMLPPPPPPPMARPVPLPVPDTKPPTTSTEGGAASPTSPTYSTPSTSPANRFVSVGPR 480 490 500 510 520 530 >>CCDS53321.1 NFIA gene_id:4774|Hs108|chr1 (501 aa) initn: 1504 init1: 1137 opt: 1647 Z-score: 1346.2 bits: 258.4 E(32554): 1.2e-68 Smith-Waterman score: 1703; 65.4% identity (81.6% similar) in 425 aa overlap (11-427:2-409) 10 20 30 40 50 60 pF1KE1 MYSSPLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKDEERAVKDE :::::::::::::::::::::::::::::::::::::::::.:::::::: CCDS53 MDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKEEERAVKDE 10 20 30 40 50 70 80 90 100 110 120 pF1KE1 LLGEKPEVKQKWASRLLAKLRKDIRPECREDFVLSITGKKAPGCVLSNPDQKGKMRRIDC ::.:::::::::::::::::::::::: ::::::..:::: : ::::::::::::::::: CCDS53 LLSEKPEVKQKWASRLLAKLRKDIRPEYREDFVLTVTGKKPPCCVLSNPDQKGKMRRIDC 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE1 LRQADKVWRLDLVMVILFKGIPLESTDGERLVKAAQCGHPVLCVQPHHIGVAVKELDLYL :::::::::::::::::::::::::::::::::. ::..: ::::::::::.:::::::: CCDS53 LRQADKVWRLDLVMVILFKGIPLESTDGERLVKSPQCSNPGLCVQPHHIGVSVKELDLYL 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE1 AYFVRERDAEQSGSPRTGMGSDQEDSKPITLDTTDFQESFVTSGVFSVTELIQVSRTPVV ::::. :. :: :: .: .: .: . ::.:::::::::::::..::.::.. CCDS53 AYFVHAADSSQSESPSQPSDADIKD-QPEN-GHLGFQDSFVTSGVFSVTELVRVSQTPIA 180 190 200 210 220 250 260 270 280 290 pF1KE1 TGTGPNFSLGELQGHLAYDLNPASTGLRRTLPSTSSSGS-KRHKSGSMEEDVDTSPGGD- .::::::::..:.. :...:.. .::.::::::..: :: :: .:...: ::: . CCDS53 AGTGPNFSLSDLESSSYYSMSPGA--MRRSLPSTSSTSSTKRLKS--VEDEMD-SPGEEP 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE1 YYT----SPSSPTSSSRNWTEDMEGGISSPVKKTEMDKSPFNSPSPQDSPRL-SSFTQHH .:: ::.: ..:: .: : .: :. ::. . .:: :.::::... : ..::::: CCDS53 FYTGQGRSPGSGSQSS-GWHE-VEPGMPSPTTLKKSEKSGFSSPSPSQTSSLGTAFTQHH 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE1 RPVIAVHSGIARSPHPS-SALHFPTTSILPQTASTYFPHTAIRYPPHLNPQDPLKDLVSL :::: .: ::: . :.:::::. :. : . :: : :::: .::. ::..:.: CCDS53 RPVI---TGPRASPHATPSTLHFPTSPIIQQPGP-YFSHPAIRY----HPQETLKEFVQL 350 360 370 380 390 420 pF1KE1 ACDPASQQPGPSWYLG .: :.:: : .: CCDS53 VCPDAGQQAGQVGFLNPNGSSQGKVHNPFLPTPMLPPPPPPPMARPVPLPVPDTKPPTTS 400 410 420 430 440 450 >>CCDS45996.1 NFIX gene_id:4784|Hs108|chr19 (441 aa) initn: 1477 init1: 1154 opt: 1617 Z-score: 1322.8 bits: 253.9 E(32554): 2.3e-67 Smith-Waterman score: 1617; 62.1% identity (78.7% similar) in 428 aa overlap (1-420:1-414) 10 20 30 40 50 60 pF1KE1 MYSSPLCLTQDEFHPFIEALLPHVRAFAYTWFNLQARKRKYFKKHEKRMSKDEERAVKDE ::: : :::::::::::::::::::::.:::::::::::::::::::::::::::::::: CCDS45 MYS-PYCLTQDEFHPFIEALLPHVRAFSYTWFNLQARKRKYFKKHEKRMSKDEERAVKDE 10 20 30 40 50 70 80 90 100 110 120 pF1KE1 LLGEKPEVKQKWASRLLAKLRKDIRPECREDFVLSITGKKAPGCVLSNPDQKGKMRRIDC :::::::.::::::::::::::::::: ::::::.::::: : :::::::::::.::::: CCDS45 LLGEKPEIKQKWASRLLAKLRKDIRPEFREDFVLTITGKKPPCCVLSNPDQKGKIRRIDC 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE1 LRQADKVWRLDLVMVILFKGIPLESTDGERLVKAAQCGHPVLCVQPHHIGVAVKELDLYL ::::::::::::::::::::::::::::::: :. ::..: ::::::::::..::::::: CCDS45 LRQADKVWRLDLVMVILFKGIPLESTDGERLYKSPQCSNPGLCVQPHHIGVTIKELDLYL 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE1 AYFVRERDAEQSGSPRTGMGSDQEDSKPITLDTTDFQESFVTSGVFSVTELIQVSRTPVV ::::. .. :: : ... .: : ::. .::. ::::::..::::..::.:::. CCDS45 AYFVHTPESGQSDS--SNQQGDA-DIKPLPNGHLSFQDCFVTSGVWNVTELVRVSQTPVA 180 190 200 210 220 230 250 260 270 280 290 pF1KE1 TGTGPNFSLGELQGHLAYDLNPASTGLRRTLPSTSSSGSKRHKS---GSMEEDVDTS--P :..::::::..:.. :..: .. : : :.: .:: :: . :: :: : CCDS45 TASGPNFSLADLESPSYYNINQVTLGRRSITSPPSTSTTKRPKSIDDSEMESPVDDVFYP 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE1 GGDYYTSPSSPTSSSRNWTEDMEGGISSPVKKTEMDKSPFNSP--SPQDSPRLSSFTQHH : ::.. .:.: .: .:...: .: :. ..: : : : .:::.. ::.: CCDS45 GTGR--SPAAGSSQSSGWPNDVDAGPASLKKSGKLD---FCSALSSQGSSPRMA-FTHHP 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE1 RPVIA-VHSGIARSPHPSSALHFPTTSILPQTASTYFPHTAIRYPPHLNPQDPLKDLVSL ::.: :. : :. .::::::.:::. :. : :: : .::: : . :: ::..:.. CCDS45 LPVLAGVRPGSPRAT--ASALHFPSTSIIQQS-SPYFTHPTIRYHHH-HGQDSLKEFVQF 360 370 380 390 400 420 pF1KE1 ACDPASQQPGPSWYLG .:. .: : CCDS45 VCSDGSGQATGQHSQRQAPPLPTGLSASDPGTATF 410 420 430 440 428 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 01:43:59 2016 done: Mon Nov 7 01:44:00 2016 Total Scan time: 3.410 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]