FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3205, 476 aa 1>>>pF1KE3205 476 - 476 aa - 476 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.6315+/-0.000782; mu= 16.5847+/- 0.047 mean_var=69.9727+/-13.977, 0's: 0 Z-trim(108.4): 11 B-trim: 66 in 1/50 Lambda= 0.153324 statistics sampled from 10198 (10205) to 10198 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.679), E-opt: 0.2 (0.313), width: 16 Scan time: 3.330 The best scores are: opt bits E(32554) CCDS10425.1 NARFL gene_id:64428|Hs108|chr16 ( 476) 3222 721.7 4.3e-208 CCDS76798.1 NARFL gene_id:64428|Hs108|chr16 ( 374) 2556 574.3 7.7e-164 CCDS32777.1 NARF gene_id:26502|Hs108|chr17 ( 456) 1465 333.0 4e-91 CCDS42404.1 NARF gene_id:26502|Hs108|chr17 ( 397) 1372 312.4 5.6e-85 CCDS42403.1 NARF gene_id:26502|Hs108|chr17 ( 408) 1322 301.3 1.2e-81 >>CCDS10425.1 NARFL gene_id:64428|Hs108|chr16 (476 aa) initn: 3222 init1: 3222 opt: 3222 Z-score: 3849.5 bits: 721.7 E(32554): 4.3e-208 Smith-Waterman score: 3222; 100.0% identity (100.0% similar) in 476 aa overlap (1-476:1-476) 10 20 30 40 50 60 pF1KE3 MASPFSGALQLTDLDDFIGPSQECIKPVKVEKRAGSGVAKIRIEDDGSYFQINQDGGTRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MASPFSGALQLTDLDDFIGPSQECIKPVKVEKRAGSGVAKIRIEDDGSYFQINQDGGTRR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 LEKAKVSLNDCLACSGCITSAETVLITQQSHEELKKVLDANKMAAPSQQRLVVVSVSPQS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LEKAKVSLNDCLACSGCITSAETVLITQQSHEELKKVLDANKMAAPSQQRLVVVSVSPQS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 RASLAARFQLNPTDTARKLTSFFKKIGVHFVFDTAFSRHFSLLESQREFVRRFRGQADCR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 RASLAARFQLNPTDTARKLTSFFKKIGVHFVFDTAFSRHFSLLESQREFVRRFRGQADCR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 QALPLLASACPGWICYAEKTHGSFILPHISTARSPQQVMGSLVKDFFAQQQHLTPDKIYH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 QALPLLASACPGWICYAEKTHGSFILPHISTARSPQQVMGSLVKDFFAQQQHLTPDKIYH 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 VTVMPCYDKKLEASRPDFFNQEHQTRDVDCVLTTGEVFRLLEEEGVSLPDLEPAPLDSLC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 VTVMPCYDKKLEASRPDFFNQEHQTRDVDCVLTTGEVFRLLEEEGVSLPDLEPAPLDSLC 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 SGASAEEPTSHRGGGSGGYLEHVFRHAARELFGIHVAEVTYKPLRNKDFQEVTLEKEGQV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 SGASAEEPTSHRGGGSGGYLEHVFRHAARELFGIHVAEVTYKPLRNKDFQEVTLEKEGQV 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 LLHFAMAYGFRNIQNLVQRLKRGRCPYHYVEVMACPSGCLNGGGQLQAPDRPSRELLQHV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LLHFAMAYGFRNIQNLVQRLKRGRCPYHYVEVMACPSGCLNGGGQLQAPDRPSRELLQHV 370 380 390 400 410 420 430 440 450 460 470 pF1KE3 ERLYGMVRAEAPEDAPGVQELYTHWLQGTDSECAGRLLHTQYHAVEKASTGLGIRW :::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 ERLYGMVRAEAPEDAPGVQELYTHWLQGTDSECAGRLLHTQYHAVEKASTGLGIRW 430 440 450 460 470 >>CCDS76798.1 NARFL gene_id:64428|Hs108|chr16 (374 aa) initn: 2556 init1: 2556 opt: 2556 Z-score: 3054.9 bits: 574.3 E(32554): 7.7e-164 Smith-Waterman score: 2556; 100.0% identity (100.0% similar) in 374 aa overlap (103-476:1-374) 80 90 100 110 120 130 pF1KE3 ACSGCITSAETVLITQQSHEELKKVLDANKMAAPSQQRLVVVSVSPQSRASLAARFQLNP :::::::::::::::::::::::::::::: CCDS76 MAAPSQQRLVVVSVSPQSRASLAARFQLNP 10 20 30 140 150 160 170 180 190 pF1KE3 TDTARKLTSFFKKIGVHFVFDTAFSRHFSLLESQREFVRRFRGQADCRQALPLLASACPG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 TDTARKLTSFFKKIGVHFVFDTAFSRHFSLLESQREFVRRFRGQADCRQALPLLASACPG 40 50 60 70 80 90 200 210 220 230 240 250 pF1KE3 WICYAEKTHGSFILPHISTARSPQQVMGSLVKDFFAQQQHLTPDKIYHVTVMPCYDKKLE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 WICYAEKTHGSFILPHISTARSPQQVMGSLVKDFFAQQQHLTPDKIYHVTVMPCYDKKLE 100 110 120 130 140 150 260 270 280 290 300 310 pF1KE3 ASRPDFFNQEHQTRDVDCVLTTGEVFRLLEEEGVSLPDLEPAPLDSLCSGASAEEPTSHR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 ASRPDFFNQEHQTRDVDCVLTTGEVFRLLEEEGVSLPDLEPAPLDSLCSGASAEEPTSHR 160 170 180 190 200 210 320 330 340 350 360 370 pF1KE3 GGGSGGYLEHVFRHAARELFGIHVAEVTYKPLRNKDFQEVTLEKEGQVLLHFAMAYGFRN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 GGGSGGYLEHVFRHAARELFGIHVAEVTYKPLRNKDFQEVTLEKEGQVLLHFAMAYGFRN 220 230 240 250 260 270 380 390 400 410 420 430 pF1KE3 IQNLVQRLKRGRCPYHYVEVMACPSGCLNGGGQLQAPDRPSRELLQHVERLYGMVRAEAP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS76 IQNLVQRLKRGRCPYHYVEVMACPSGCLNGGGQLQAPDRPSRELLQHVERLYGMVRAEAP 280 290 300 310 320 330 440 450 460 470 pF1KE3 EDAPGVQELYTHWLQGTDSECAGRLLHTQYHAVEKASTGLGIRW :::::::::::::::::::::::::::::::::::::::::::: CCDS76 EDAPGVQELYTHWLQGTDSECAGRLLHTQYHAVEKASTGLGIRW 340 350 360 370 >>CCDS32777.1 NARF gene_id:26502|Hs108|chr17 (456 aa) initn: 1438 init1: 823 opt: 1465 Z-score: 1749.4 bits: 333.0 E(32554): 4e-91 Smith-Waterman score: 1465; 48.1% identity (77.0% similar) in 457 aa overlap (22-476:9-456) 10 20 30 40 50 pF1KE3 MASPFSGALQLTDLDDFIGPSQECIKPVKVEKRAGSGVAKIRIEDDGSYFQINQDGGT-R .:: : .:.. . . .. : : : : . : . CCDS32 MKCEHCTRKECSKKTKTDDQENVSA------DAPSPAQENGEKGEFH 10 20 30 40 60 70 80 90 100 110 pF1KE3 RLEKAKVSLNDCLACSGCITSAETVLITQQSHEELKKVLDANKMAAPSQQRLVVVSVSPQ .: ::. :.:::::..:.:. : : ..::. ... .::. :: :.....:::: :: CCDS32 KLADAKIFLSDCLACDSCMTAEEGVQLSQQNAKDFFRVLNLNKKCDTSKHKVLVVSVCPQ 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE3 SRASLAARFQLNPTDTARKLTSFFKKIGVHFVFDTAFSRHFSLLESQREFVRRFRGQADC : .::.:.:. ::..:.: .:.:..:::.::::... ::.::::.:::::.: ... CCDS32 SLPYFAAKFNLSVTDASRRLCGFLKSLGVHYVFDTTIAADFSILESQKEFVRRYRQHSEE 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE3 RQALPLLASACPGWICYAEKTHGSFILPHISTARSPQQVMGSLVKDFFAQQQHLTPDKIY ...::.:.::::::. :::.. : : :. ::.::::::::::::.::.::.:.:.::. CCDS32 ERTLPMLTSACPGWVRYAERVLGRPITAHLCTAKSPQQVMGSLVKDYFARQQNLSPEKIF 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE3 HVTVMPCYDKKLEASRPDFFNQEHQTRDVDCVLTTGEVFRLLEEEGVSLPDLEPAPLDSL :: : ::::::::: . .. : .: .:::::.::. ...:. .:. : : .:.: CCDS32 HVIVAPCYDKKLEALQESLPPALHGSRGADCVLTSGEIAQIMEQGDLSVRD---AAVDTL 230 240 250 260 270 300 310 320 330 340 350 pF1KE3 CSGASAEEPTSHRGGGSGGYLEHVFRHAARELFGIHVAEVTYKPLRNKDFQEVTLEKEGQ . . .. : : :..: :.: :.:::::.:::. : ::::. :::::::::::::.:. CCDS32 FGDLKEDKVTRHDGASSDGHLAHIFRHAAKELFNEDVEEVTYRALRNKDFQEVTLEKNGE 280 290 300 310 320 330 360 370 380 390 400 410 pF1KE3 VLLHFAMAYGFRNIQNLVQRLKRGRCPYHYVEVMACPSGCLNGGGQLQAPD-RPSRELLQ :.:.:: :::::::::.. .::.:. :.:.:::.:: .::::: :: :.:: . .. ::. CCDS32 VVLRFAAAYGFRNIQNMILKLKKGKFPFHFVEVLACAGGCLNGRGQAQTPDGHADKALLR 340 350 360 370 380 390 420 430 440 450 460 470 pF1KE3 HVERLYGMVRAEAPEDAPGVQELYTHWLQGTDSECAGRLLHTQYHAVEKASTGLGIRW ..: .:. . .. ::.. ::::: .::.: .: : ..::: :.. :... .: :.: CCDS32 QMEGIYADIPVRRPESSAHVQELYQEWLEGINSPKAREVLHTTYQSQERGTHSLDIKW 400 410 420 430 440 450 >>CCDS42404.1 NARF gene_id:26502|Hs108|chr17 (397 aa) initn: 1357 init1: 742 opt: 1372 Z-score: 1639.1 bits: 312.4 E(32554): 5.6e-85 Smith-Waterman score: 1372; 50.2% identity (79.5% similar) in 400 aa overlap (78-476:1-397) 50 60 70 80 90 100 pF1KE3 SYFQINQDGGTRRLEKAKVSLNDCLACSGCITSAETVLITQQSHEELKKVLDANKMAAPS .:. : : ..::. ... .::. :: : CCDS42 MTAEEGVQLSQQNAKDFFRVLNLNKKCDTS 10 20 30 110 120 130 140 150 160 pF1KE3 QQRLVVVSVSPQSRASLAARFQLNPTDTARKLTSFFKKIGVHFVFDTAFSRHFSLLESQR .....:::: ::: .::.:.:. ::..:.: .:.:..:::.::::... ::.::::. CCDS42 KHKVLVVSVCPQSLPYFAAKFNLSVTDASRRLCGFLKSLGVHYVFDTTIAADFSILESQK 40 50 60 70 80 90 170 180 190 200 210 220 pF1KE3 EFVRRFRGQADCRQALPLLASACPGWICYAEKTHGSFILPHISTARSPQQVMGSLVKDFF :::::.: ... ...::.:.::::::. :::.. : : :. ::.::::::::::::.: CCDS42 EFVRRYRQHSEEERTLPMLTSACPGWVRYAERVLGRPITAHLCTAKSPQQVMGSLVKDYF 100 110 120 130 140 150 230 240 250 260 270 280 pF1KE3 AQQQHLTPDKIYHVTVMPCYDKKLEASRPDFFNQEHQTRDVDCVLTTGEVFRLLEEEGVS :.::.:.:.::.:: : ::::::::: . .. : .: .:::::.::. ...:. .: CCDS42 ARQQNLSPEKIFHVIVAPCYDKKLEALQESLPPALHGSRGADCVLTSGEIAQIMEQGDLS 160 170 180 190 200 210 290 300 310 320 330 340 pF1KE3 LPDLEPAPLDSLCSGASAEEPTSHRGGGSGGYLEHVFRHAARELFGIHVAEVTYKPLRNK . : : .:.: . . .. : : :..: :.: :.:::::.:::. : ::::. :::: CCDS42 VRD---AAVDTLFGDLKEDKVTRHDGASSDGHLAHIFRHAAKELFNEDVEEVTYRALRNK 220 230 240 250 260 350 360 370 380 390 400 pF1KE3 DFQEVTLEKEGQVLLHFAMAYGFRNIQNLVQRLKRGRCPYHYVEVMACPSGCLNGGGQLQ :::::::::.:.:.:.:: :::::::::.. .::.:. :.:.:::.:: .::::: :: : CCDS42 DFQEVTLEKNGEVVLRFAAAYGFRNIQNMILKLKKGKFPFHFVEVLACAGGCLNGRGQAQ 270 280 290 300 310 320 410 420 430 440 450 460 pF1KE3 APD-RPSRELLQHVERLYGMVRAEAPEDAPGVQELYTHWLQGTDSECAGRLLHTQYHAVE .:: . .. ::...: .:. . .. ::.. ::::: .::.: .: : ..::: :.. : CCDS42 TPDGHADKALLRQMEGIYADIPVRRPESSAHVQELYQEWLEGINSPKAREVLHTTYQSQE 330 340 350 360 370 380 470 pF1KE3 KASTGLGIRW ... .: :.: CCDS42 RGTHSLDIKW 390 >>CCDS42403.1 NARF gene_id:26502|Hs108|chr17 (408 aa) initn: 1306 init1: 691 opt: 1322 Z-score: 1579.2 bits: 301.3 E(32554): 1.2e-81 Smith-Waterman score: 1322; 48.4% identity (76.8% similar) in 409 aa overlap (71-476:3-408) 50 60 70 80 90 pF1KE3 IRIEDDGSYFQINQDGGTRRLEKAKVSLNDCLACSGCITSAETVLITQQ--SHEELKKVL : :. : .: :. : . . . CCDS42 MKCEHCTRKECSKKTKTDDQENVSADAPSPAQ 10 20 30 100 110 120 130 140 150 pF1KE3 DANKMAAPSQQRLVVVSVSPQSRASLAARFQLNPTDTARKLTSFFKKIGVHFVFDTAFSR . .. :.....:::: ::: .::.:.:. ::..:.: .:.:..:::.::::... CCDS42 ENGEKCDTSKHKVLVVSVCPQSLPYFAAKFNLSVTDASRRLCGFLKSLGVHYVFDTTIAA 40 50 60 70 80 90 160 170 180 190 200 210 pF1KE3 HFSLLESQREFVRRFRGQADCRQALPLLASACPGWICYAEKTHGSFILPHISTARSPQQV ::.::::.:::::.: ... ...::.:.::::::. :::.. : : :. ::.::::: CCDS42 DFSILESQKEFVRRYRQHSEEERTLPMLTSACPGWVRYAERVLGRPITAHLCTAKSPQQV 100 110 120 130 140 150 220 230 240 250 260 270 pF1KE3 MGSLVKDFFAQQQHLTPDKIYHVTVMPCYDKKLEASRPDFFNQEHQTRDVDCVLTTGEVF :::::::.::.::.:.:.::.:: : ::::::::: . .. : .: .:::::.::. CCDS42 MGSLVKDYFARQQNLSPEKIFHVIVAPCYDKKLEALQESLPPALHGSRGADCVLTSGEIA 160 170 180 190 200 210 280 290 300 310 320 330 pF1KE3 RLLEEEGVSLPDLEPAPLDSLCSGASAEEPTSHRGGGSGGYLEHVFRHAARELFGIHVAE ...:. .:. : : .:.: . . .. : : :..: :.: :.:::::.:::. : : CCDS42 QIMEQGDLSVRD---AAVDTLFGDLKEDKVTRHDGASSDGHLAHIFRHAAKELFNEDVEE 220 230 240 250 260 340 350 360 370 380 390 pF1KE3 VTYKPLRNKDFQEVTLEKEGQVLLHFAMAYGFRNIQNLVQRLKRGRCPYHYVEVMACPSG :::. :::::::::::::.:.:.:.:: :::::::::.. .::.:. :.:.:::.:: .: CCDS42 VTYRALRNKDFQEVTLEKNGEVVLRFAAAYGFRNIQNMILKLKKGKFPFHFVEVLACAGG 270 280 290 300 310 320 400 410 420 430 440 450 pF1KE3 CLNGGGQLQAPD-RPSRELLQHVERLYGMVRAEAPEDAPGVQELYTHWLQGTDSECAGRL :::: :: :.:: . .. ::...: .:. . .. ::.. ::::: .::.: .: : .. CCDS42 CLNGRGQAQTPDGHADKALLRQMEGIYADIPVRRPESSAHVQELYQEWLEGINSPKAREV 330 340 350 360 370 380 460 470 pF1KE3 LHTQYHAVEKASTGLGIRW ::: :.. :... .: :.: CCDS42 LHTTYQSQERGTHSLDIKW 390 400 476 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 23:39:04 2016 done: Sat Nov 5 23:39:04 2016 Total Scan time: 3.330 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]