FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4474, 493 aa 1>>>pF1KE4474 493 - 493 aa - 493 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.8755+/-0.00102; mu= 14.2315+/- 0.061 mean_var=64.8093+/-13.066, 0's: 0 Z-trim(103.3): 21 B-trim: 34 in 1/48 Lambda= 0.159315 statistics sampled from 7325 (7331) to 7325 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.597), E-opt: 0.2 (0.225), width: 16 Scan time: 3.050 The best scores are: opt bits E(32554) CCDS5342.1 FSCN1 gene_id:6624|Hs108|chr7 ( 493) 3306 769.1 0 CCDS45811.1 FSCN2 gene_id:25794|Hs108|chr17 ( 492) 1914 449.1 4.9e-126 CCDS45810.1 FSCN2 gene_id:25794|Hs108|chr17 ( 516) 1539 363.0 4.5e-100 CCDS34746.1 FSCN3 gene_id:29999|Hs108|chr7 ( 498) 656 160.0 5.4e-39 >>CCDS5342.1 FSCN1 gene_id:6624|Hs108|chr7 (493 aa) initn: 3306 init1: 3306 opt: 3306 Z-score: 4105.3 bits: 769.1 E(32554): 0 Smith-Waterman score: 3306; 100.0% identity (100.0% similar) in 493 aa overlap (1-493:1-493) 10 20 30 40 50 60 pF1KE4 MTANGTAEAVQIQFGLINCGNKYLTAEAFGFKVNASASSLKKKQIWTLEQPPDEAGSAAV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 MTANGTAEAVQIQFGLINCGNKYLTAEAFGFKVNASASSLKKKQIWTLEQPPDEAGSAAV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 CLRSHLGRYLAADKDGNVTCEREVPGPDCRFLIVAHDDGRWSLQSEAHRRYFGGTEDRLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 CLRSHLGRYLAADKDGNVTCEREVPGPDCRFLIVAHDDGRWSLQSEAHRRYFGGTEDRLS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 CFAQTVSPAEKWSVHIAMHPQVNIYSVTRKRYAHLSARPADEIAVDRDVPWGVDSLITLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 CFAQTVSPAEKWSVHIAMHPQVNIYSVTRKRYAHLSARPADEIAVDRDVPWGVDSLITLA 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 FQDQRYSVQTADHRFLRHDGRLVARPEPATGYTLEFRSGKVAFRDCEGRYLAPSGPSGTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 FQDQRYSVQTADHRFLRHDGRLVARPEPATGYTLEFRSGKVAFRDCEGRYLAPSGPSGTL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 KAGKATKVGKDELFALEQSCAQVVLQAANERNVSTRQGMDLSANQDEETDQETFQLEIDR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 KAGKATKVGKDELFALEQSCAQVVLQAANERNVSTRQGMDLSANQDEETDQETFQLEIDR 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 DTKKCAFRTHTGKYWTLTATGGVQSTASSKNASCYFDIEWRDRRITLRASNGKFVTSKKN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 DTKKCAFRTHTGKYWTLTATGGVQSTASSKNASCYFDIEWRDRRITLRASNGKFVTSKKN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 GQLAASVETAGDSELFLMKLINRPIIVFRGEHGFIGCRKVTGTLDANRSSYDVFQLEFND :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 GQLAASVETAGDSELFLMKLINRPIIVFRGEHGFIGCRKVTGTLDANRSSYDVFQLEFND 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 GAYNIKDSTGKYWTVGSDSAVTSSGDTPVDFFFEFCDYNKVAIKVGGRYLKGDHAGVLKA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 GAYNIKDSTGKYWTVGSDSAVTSSGDTPVDFFFEFCDYNKVAIKVGGRYLKGDHAGVLKA 430 440 450 460 470 480 490 pF1KE4 SAETVDPASLWEY ::::::::::::: CCDS53 SAETVDPASLWEY 490 >>CCDS45811.1 FSCN2 gene_id:25794|Hs108|chr17 (492 aa) initn: 1903 init1: 1170 opt: 1914 Z-score: 2376.2 bits: 449.1 E(32554): 4.9e-126 Smith-Waterman score: 1914; 56.2% identity (81.4% similar) in 495 aa overlap (1-493:1-492) 10 20 30 40 50 60 pF1KE4 MTANGTAEAVQIQFGLINCGNKYLTAEAFGFKVNASASSLKKKQIWTLEQPPDEAGSAAV : .:: ....:::::.: ..:::::.::::::::: :::.:: :.:: :: . ..:: CCDS45 MPTNGLHQVLKIQFGLVNDTDRYLTAESFGFKVNASAPSLKRKQTWVLE--PDPGQGTAV 10 20 30 40 50 70 80 90 100 110 pF1KE4 CLRS-HLGRYLAADKDGNVTCEREVPGPDCRFLIVAHDDGRWSLQSEAHRRYFGGTEDRL ::: ::::::.:..:: :.:: : :: :::::.. . :::: :.:: : :.::::::.: CCDS45 LLRSSHLGRYLSAEEDGRVACEAEQPGRDCRFLVLPQPDGRWVLRSEPHGRFFGGTEDQL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE4 SCFAQTVSPAEKWSVHIAMHPQVNIYSVTRKRYAHLSARPADEIAVDRDVPWGVDSLITL :::: .::::: :.::.:.:::... ::.:.::.:: : ::.:.: : :::::.:.:: CCDS45 SCFATAVSPAELWTVHLAIHPQAHLLSVSRRRYVHLCPRE-DEMAADGDKPWGVDALLTL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE4 AFQDQRYSVQTADHRFLRHDGRLVARPEPATGYTLEFRSGKVAFRDCEGRYLAPSGPSGT :...:: ... : :.:: ::::: .::: . :::::..::.::.::.:.:::: ::.:: CCDS45 IFRSRRYCLKSCDSRYLRSDGRLVWEPEPRACYTLEFKAGKLAFKDCDGHYLAPVGPAGT 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE4 LKAGKATKVGKDELFALEQSCAQVVLQAANERNVSTRQGMDLSANQDEETDQETFQLEID ::::. :. :::::: ::.: :::: :::.: ::.:::...:::::.: :.::: ..:: CCDS45 LKAGRNTRPGKDELFDLEESHPQVVLVAANHRYVSVRQGVNVSANQDDELDHETFLMQID 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE4 RDTKKCAFRTHTGKYWTLTATGGVQSTASSKNASCYFDIEWRDRRITLRASNGKFVTSKK ..::::.: . :: ::::.. ::...::.. .:. .:..::: ::..:.::::..: :: CCDS45 QETKKCTFYSSTGGYWTLVTHGGIHATATQVSANTMFEMEWRGRRVALKASNGRYVCMKK 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE4 NGQLAASVETAGDSELFLMKLINRPIIVFRGEHGFIGCRKVTGTLDANRSSYDVFQLEFN :::::: . .: .: : .:::::::.:.:: ::. .. .. ::.::: ::::.: :. CCDS45 NGQLAAISDFVGKDEEFTLKLINRPILVLRGLDGFVCHHRGSNQLDTNRSVYDVFHLSFS 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE4 DGAYNIKDSTGKYWTVGSDSAVTSSGDTPVDFFFEFCDYNKVAIKV-GGRYLKGDHAGVL :::: :. : .: .:: ..: :.:. :: ::: . ...::.. .:.::.: .:.: CCDS45 DGAYRIRGRDGGFWYTGSHGSVCSDGERAEDFVFEFRERGRLAIRARSGKYLRGGASGLL 420 430 440 450 460 470 480 490 pF1KE4 KASAETVDPASLWEY .:.:.. ..:::: CCDS45 RADADAPAGTALWEY 480 490 >>CCDS45810.1 FSCN2 gene_id:25794|Hs108|chr17 (516 aa) initn: 1415 init1: 870 opt: 1539 Z-score: 1910.1 bits: 363.0 E(32554): 4.5e-100 Smith-Waterman score: 1861; 53.6% identity (77.6% similar) in 519 aa overlap (1-493:1-516) 10 20 30 40 50 60 pF1KE4 MTANGTAEAVQIQFGLINCGNKYLTAEAFGFKVNASASSLKKKQIWTLEQPPDEAGSAAV : .:: ....:::::.: ..:::::.::::::::: :::.:: :.:: :: . ..:: CCDS45 MPTNGLHQVLKIQFGLVNDTDRYLTAESFGFKVNASAPSLKRKQTWVLE--PDPGQGTAV 10 20 30 40 50 70 80 90 100 110 pF1KE4 CLRS-HLGRYLAADKDGNVTCEREVPGPDCRFLIVAHDDGRWSLQSEAHRRYFGGTEDRL ::: ::::::.:..:: :.:: : :: :::::.. . :::: :.:: : :.::::::.: CCDS45 LLRSSHLGRYLSAEEDGRVACEAEQPGRDCRFLVLPQPDGRWVLRSEPHGRFFGGTEDQL 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE4 SCFAQTVSPAEKWSVHIAMHPQVNIYSVTRKRYAHLSARPADEIAVDRDVPWGVDSLITL :::: .::::: :.::.:.:::... ::.:.::.:: : ::.:.: : :::::.:.:: CCDS45 SCFATAVSPAELWTVHLAIHPQAHLLSVSRRRYVHLCPRE-DEMAADGDKPWGVDALLTL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE4 AFQDQRYSVQTADHRFLRHDGRLVARPEPATGYTLEFRSGKVAFRDCEGRYLAPSGPSGT :...:: ... : :.:: ::::: .::: . :::::..::.::.::.:.:::: ::.:: CCDS45 IFRSRRYCLKSCDSRYLRSDGRLVWEPEPRACYTLEFKAGKLAFKDCDGHYLAPVGPAGT 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE4 LKAGKATKVGKDELFALEQSCAQVVLQAANERNVSTRQGMDLSANQDEETDQETFQLEID ::::. :. :::::: ::.: :::: :::.: ::.:::...:::::.: :.::: ..:: CCDS45 LKAGRNTRPGKDELFDLEESHPQVVLVAANHRYVSVRQGVNVSANQDDELDHETFLMQID 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE4 RDTKKCAFRTHTGKYWTLTATGGVQSTASSKNASCYFDIEWRDRRITLRASNGKFVTSKK ..::::.: . :: ::::.. ::...::.. .:. .:..::: ::..:.::::..: :: CCDS45 QETKKCTFYSSTGGYWTLVTHGGIHATATQVSANTMFEMEWRGRRVALKASNGRYVCMKK 300 310 320 330 340 350 360 370 380 390 pF1KE4 NGQLAA------------------------SVETAGDSELFLMKLINRPIIVFRGEHGFI :::::: .. : .: : .:::::::.:.:: ::. CCDS45 NGQLAAISDFVGPPPRPAWTGKVAGGAAQQTLSPPGKDEEFTLKLINRPILVLRGLDGFV 360 370 380 390 400 410 400 410 420 430 440 450 pF1KE4 GCRKVTGTLDANRSSYDVFQLEFNDGAYNIKDSTGKYWTVGSDSAVTSSGDTPVDFFFEF .. .. ::.::: ::::.: :.:::: :. : .: .:: ..: :.:. :: ::: CCDS45 CHHRGSNQLDTNRSVYDVFHLSFSDGAYRIRGRDGGFWYTGSHGSVCSDGERAEDFVFEF 420 430 440 450 460 470 460 470 480 490 pF1KE4 CDYNKVAIKV-GGRYLKGDHAGVLKASAETVDPASLWEY . ...::.. .:.::.: .:.:.:.:.. ..:::: CCDS45 RERGRLAIRARSGKYLRGGASGLLRADADAPAGTALWEY 480 490 500 510 >>CCDS34746.1 FSCN3 gene_id:29999|Hs108|chr7 (498 aa) initn: 319 init1: 224 opt: 656 Z-score: 813.5 bits: 160.0 E(32554): 5.4e-39 Smith-Waterman score: 656; 27.8% identity (57.8% similar) in 490 aa overlap (8-493:12-498) 10 20 30 40 50 pF1KE4 MTANGTAEAVQIQFGLINCGNKYLTAEAFGFKVNASASSLKKKQIWTLEQPPDEAG .: ... :::. .. ::: :: :.:.:.:: ..: : . .. CCDS34 MDETEWIHRHPKAEDLRVGLISWAGTYLTFEACKNTVTATAKSLGRRQTWEILVSNEHET 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE4 SAAVCLRSHLGRYLAADKDGNVTCEREVPGPDCRFLIVAHDDGRWSLQSEAHRRYFGGTE .:.: :.: : :: . ::.: : . ::. : ...:.:: ::. .. CCDS34 QAVVRLKSVQGLYLLCECDGTVCYGRPRTSHHGCFLLRFHRNSKWTLQCLISGRYLESNG 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE4 DRLSCFAQTVSPAEKWSVHIAMHPQVNIYSVTRKRYAHLSARPA-DEIAVDRDVPWGVDS . : ....: . :. . :.: .: .:: .. ::. : :. .: :: :: . CCDS34 KDVFCTSHVLSAYHMWTPRPALHVHVILYSPIHRCYAR--ADPTMGRIWVDAAVPCLEEC 130 140 150 160 170 180 190 200 210 220 230 pF1KE4 LITLAFQDQRYSVQTADHRFLRHDGRLVARPEPATGYTLEFRSGK-VAFRDCEGRYLAPS . : :.: : ..:. :.:: : :: ..: :.. .. : : ::. : :: .: :. CCDS34 GFLLHFRDGCYHLETSTHHFLSHVDRLFSQPSSQTAFHMQVRPGGLVALCDGEGGMLYPQ 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE4 GPSGTLKAGKATKVGKDELFALEQSCAQVVLQAANERNVSTRQGMDLSANQDEETDQETF : : : : .: : :.. . : :.. . : .:. .. : ... . . : CCDS34 GTHLLLGMGCNPMRG-EEWFILQHCPTWVSLRSKTGRFISVIYDGEVRAASERLNRMSLF 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE4 QLEIDRDTKKCAFRTHTGKYWTLTATGGVQSTASSKNASCYFDIEWRDRRITLRASNGKF :.: : .. .:. .: : . .:.. . ... .: ..: :: :.. :.: CCDS34 QFECDSESPTVQLRSANGYYLSQRRHRAVMADGHPLESDTFFRMHWNCGRIILQSCRGRF 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE4 VTSKKNGQLAASVETAGDSELFLMKLINRPIIVFRGEHGFIGCRKVTGTLDANRSSYD-V . :. : :.: : .: : . . :: ..:.::..:..: . .. :... : . CCDS34 LGIAPNSLLMANVILPGPNEEFGILFANRSFLVLRGRYGYVGSSSGHDLIQCNQDQPDRI 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE4 FQLEFNDGAYNIKDSTGKYWTVGSDSAVTSSGDTPVDFFFEFCDYNKVAIKV-GGRYLKG : : :... . :..:.. : .. : ..: .:. : ... . .: :... CCDS34 HLLPCRPGIYHFQAQGGSFWSITSFGTFRPWGKFALNFCIELQGSNLLTVLAPNGFYMRA 420 430 440 450 460 470 480 490 pF1KE4 DHAGVLKASAETVDPASLWEY :..:.: :..: . .::. CCDS34 DQSGTLLADSEDITRECIWEF 480 490 493 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 09:16:21 2016 done: Sun Nov 6 09:16:22 2016 Total Scan time: 3.050 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]